구글 제미나이 3.1 프로 출시...주요 벤치마크 1위

구글이 2월 19일 최신 AI 모델 '제미나이 3.1 프로(Gemini 3.1 Pro)'를 공개하며 주요 AI 벤치마크에서 경쟁사를 제치고 선두 자리를 되찾았다.

핵심 추론 벤치마크 '아크 AGI 2(ARC-AGI-2)'에서 77.1%를 기록해 이전 모델 제미나이 3 프로(Gemini 3 Pro, 31.1%)의 두 배 이상 성능을 끌어올렸다. 과학지식 평가 GPQA 다이아몬드(GPQA Diamond)에서는 94.3%를 달성해 앤트로픽의 클로드 오퍼스 4.6(Claude Opus 4.6, 91.3%)과 오픈AI의 GPT-5.2(92.4%)를 모두 앞섰다.

구글 CEO 순다르 피차이는 "복잡한 개념 시각화, 데이터 통합, 창의적 프로젝트에 강력한 기반이 된다"고 밝혔다. 컨텍스트 윈도우는 최대 100만 토큰 입력, 6만 4,000토큰 출력을 지원해 대규모 문서와 코드 처리가 한 번에 가능하다. 단, 코딩 벤치마크 SWE-벤치 베리파이드(SWE-Bench Verified)에서는 80.6%로 클로드 오퍼스 4.6(80.8%)에 근소하게 뒤지는 등 모든 항목에서 1위를 차지하진 못했다.

API 가격은 기존과 동일하게 100만 토큰 입력 기준 2달러(약 2,888원), 출력 기준 12달러(약 1만 7,328원)으로 유지됐으며, 현재 제미나이 앱과 노트북LM, 구글 AI 스튜디오, 버텍스AI 등에서 프리뷰로 이용 가능하다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

"구글 AI 오버뷰, 10번 중 1번 오답…출처 56%는 검증 불가"

구글 AI 오버뷰가 10번 중 1번 오답을 낸다는 연구 결과가 나왔다. 뉴욕타임스와 AI 스타트업 우미의 공동 조사에서 제미나이 3 기준 정확도는 91%지만, 정답의 56%는 출처로 검증이 불가능한 것으로 드러났다.

메타 전 직원, 이용자 비밀 사진 3만 장 ‘슬쩍’

글로벌 IT 기업 메타(Meta)의 전직 직원이 페이스북 이용자들의 비공개 사진 수만 장을 불법으로 빼돌린 혐의로 영국 수사 당국의 조사를 받고 있다.

“머스크의 칩 독립 선언”… 인텔, 초거대 AI 생산 기지 ‘테라팹’ 건설 전격 합류

일론 머스크의 인공지능(AI) 야망을 실현할 초대형 반도체 생산 시설 건설에 ‘반도체 거인’ 인텔이 구원투수로 등판한다.

블룸버그 "아이폰 폴드, 9월 출시 예정대로"…닛케이 지연설 정면 반박

블룸버그 마크 거먼이 아이폰 폴드의 9월 출시 일정이 유지되고 있다고 보도하며 닛케이아시아의 지연설을 반박했다. 초기 물량 부족 가능성은 인정했지만, 아이폰 18 프로와 동시 공개 계획은 그대로라고 전했다.