구글 제미나이 3.1 프로 출시...주요 벤치마크 1위

구글이 2월 19일 최신 AI 모델 '제미나이 3.1 프로(Gemini 3.1 Pro)'를 공개하며 주요 AI 벤치마크에서 경쟁사를 제치고 선두 자리를 되찾았다.

핵심 추론 벤치마크 '아크 AGI 2(ARC-AGI-2)'에서 77.1%를 기록해 이전 모델 제미나이 3 프로(Gemini 3 Pro, 31.1%)의 두 배 이상 성능을 끌어올렸다. 과학지식 평가 GPQA 다이아몬드(GPQA Diamond)에서는 94.3%를 달성해 앤트로픽의 클로드 오퍼스 4.6(Claude Opus 4.6, 91.3%)과 오픈AI의 GPT-5.2(92.4%)를 모두 앞섰다.

구글 CEO 순다르 피차이는 "복잡한 개념 시각화, 데이터 통합, 창의적 프로젝트에 강력한 기반이 된다"고 밝혔다. 컨텍스트 윈도우는 최대 100만 토큰 입력, 6만 4,000토큰 출력을 지원해 대규모 문서와 코드 처리가 한 번에 가능하다. 단, 코딩 벤치마크 SWE-벤치 베리파이드(SWE-Bench Verified)에서는 80.6%로 클로드 오퍼스 4.6(80.8%)에 근소하게 뒤지는 등 모든 항목에서 1위를 차지하진 못했다.

API 가격은 기존과 동일하게 100만 토큰 입력 기준 2달러(약 2,888원), 출력 기준 12달러(약 1만 7,328원)으로 유지됐으며, 현재 제미나이 앱과 노트북LM, 구글 AI 스튜디오, 버텍스AI 등에서 프리뷰로 이용 가능하다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

“몸값 3조 육박, K-엔비디아 떴다”… 리벨리온, 4억 달러 유치하며 미국 정조준

국내 AI 반도체 스타트업 리벨리온이 4억 달러(약 6,000억 원) 규모의 대규모 투자 유치에 성공하며 글로벌 시장 진출을 위한 ‘실탄’을 확보했다.

블루스카이 AI 도입에 유저 12만 명 ‘집단 차단’

탈(脫)중앙화 소셜미디어 블루스카이가 선보인 인공지능(AI) 비서 ‘아티(Attie)’가 출시와 동시에 사용자들의 거센 역풍을 맞고 있다.

"미국인 80% AI 우려, Z세대 가장 비관적"...미국 설문조사 결과

퀴니피액 대학 여론조사에서 미국인의 AI 활용률은 높아졌지만 신뢰도는 21%에 그쳤고, 70%는 AI가 일자리를 줄일 것으로 우려했다. Z세대의 비관론이 가장 강했다.

코파일럿 코워크, MS 프런티어 프로그램 통해 첫 공개…앤트 로픽 기술 탑재

마이크로소프트가 앤스로픽과 협력해 개발한 AI 업무 자동화 기능 '코파일럿 코워크'를 프런티어 조기 체험 프로그램으로 공개했다. 사용자가 목표를 설명하면 AI가 계획을 세우고 마이크로소프트 365 전반에서 작업을 직접 수행한다.