구글이 2월 19일 최신 AI 모델 '제미나이 3.1 프로(Gemini 3.1 Pro)'를 공개하며 주요 AI 벤치마크에서 경쟁사를 제치고 선두 자리를 되찾았다.
핵심 추론 벤치마크 '아크 AGI 2(ARC-AGI-2)'에서 77.1%를 기록해 이전 모델 제미나이 3 프로(Gemini 3 Pro, 31.1%)의 두 배 이상 성능을 끌어올렸다. 과학지식 평가 GPQA 다이아몬드(GPQA Diamond)에서는 94.3%를 달성해 앤트로픽의 클로드 오퍼스 4.6(Claude Opus 4.6, 91.3%)과 오픈AI의 GPT-5.2(92.4%)를 모두 앞섰다.
구글 CEO 순다르 피차이는 "복잡한 개념 시각화, 데이터 통합, 창의적 프로젝트에 강력한 기반이 된다"고 밝혔다. 컨텍스트 윈도우는 최대 100만 토큰 입력, 6만 4,000토큰 출력을 지원해 대규모 문서와 코드 처리가 한 번에 가능하다. 단, 코딩 벤치마크 SWE-벤치 베리파이드(SWE-Bench Verified)에서는 80.6%로 클로드 오퍼스 4.6(80.8%)에 근소하게 뒤지는 등 모든 항목에서 1위를 차지하진 못했다.
API 가격은 기존과 동일하게 100만 토큰 입력 기준 2달러(약 2,888원), 출력 기준 12달러(약 1만 7,328원)으로 유지됐으며, 현재 제미나이 앱과 노트북LM, 구글 AI 스튜디오, 버텍스AI 등에서 프리뷰로 이용 가능하다.
