Google is unveiling Gemini 2.5, a next-generation AI reasoning model that "thinks" before answering, challenging OpenAI. The Gemini 2.5 Pro Experimental, a multimodal reasoning AI model, is touted by Google as its most intelligent yet, available on Google AI Studio and the Gemini app for Gemini Advanced subscribers. Google plans to integrate reasoning capabilities into all future AI models. This move follows OpenAI's launch of "o1" in September 2024, intensifying the competition in AI reasoning models among companies like Anthropic, DeepSeek, and xAI. These models use extra processing power to verify facts and reason through problems before providing answers, making them crucial for developing AI agents and autonomous systems. While Google previously released a "thinking" Gemini, the Gemini 2.5 is seen as a more serious attempt to surpass OpenAI's "o" series. Google claims that Gemini 2.5 Pro outperforms previous models in coding and web app development, achieving a score of 68.6% on the Aider Polyglot code editing test, surpassing models from OpenAI, Anthropic, and DeepSeek. However, it scored lower than Anthropic's Claude 3.7 Sonnet on the SWE-bench Verified software development test. Gemini 2.5 Pro supports a 1 million token context window, allowing it to process text equivalent to the entire "Lord of the Rings" series at once, with plans to expand to 2 million tokens. API pricing is yet to be announced.
구글이 질문에 답하기 전 '생각'하는 차세대 AI 추론 모델 '제미나이 2.5'를 공개하며 오픈AI에 도전장을 던졌다. 이번에 공개된 '제미나이 2.5 프로 익스페리멘탈'은 멀티모달 추론 AI 모델로, 구글은 자사의 가장 지능적인 모델이라고 주장한다. 이 모델은 Google AI Studio와 Gemini Advanced 구독자를 위한 Gemini 앱에서 사용할 수 있다. 구글은 향후 출시될 모든 AI 모델에 추론 기능을 내장할 계획이다. 오픈AI가 2024년 9월 'o1'을 출시하며 AI 추론 모델 경쟁에 불을 지핀 가운데, 구글은 앤스로픽, 딥시크, xAI 등과 함께 AI 에이전트 개발의 핵심 기술로 꼽히는 추론 모델 개발에 박차를 가하고 있다. 구글은 이미 '생각하는' 제미나이 버전을 공개한 바 있지만, 이번 '제미나이 2.5'는 오픈AI의 'o' 시리즈 모델을 능가하려는 가장 적극적인 시도로 평가된다. 구글은 '제미나이 2.5 프로'가 코드 편집 및 웹 앱 개발 등 특정 분야에서 경쟁 모델들을 능가한다고 주장했다. '제미나이 2.5 프로'는 100만 토큰 컨텍스트 창을 지원해 '반지의 제왕' 소설 시리즈 전체 분량에 해당하는 텍스트를 한 번에 처리할 수 있다. 향후 200만 토큰까지 확장을 계획하고 있다. API 가격은 아직 공개되지 않았다.
