구글, 컴퓨터 사용 AI 에이전트 '제미나이 2.5 컴퓨터 유즈' 모델 공개

구글이 사용자 인터페이스와 직접 상호작용할 수 있는 제미나이 2.5 컴퓨터 유즈(Gemini 2.5 Computer Use) 모델을 공개 프리뷰로 출시했다.

이 모델은 제미나이 2.5 프로의 시각 이해와 추론 능력을 기반으로 웹페이지와 앱을 클릭, 입력, 스크롤하며 작동하는 AI 에이전트 구축을 지원한다. 온라인-마인드투웹(Online-Mind2Web), 웹보이저(WebVoyager), 안드로이드월드(AndroidWorld) 등 여러 벤치마크에서 경쟁 모델을 앞서며 가장 낮은 지연시간을 기록했다. 웹 브라우저 제어에 최적화됐으며 모바일 UI 제어에도 강력한 성능을 보이지만 데스크톱 OS 수준 제어는 아직 최적화되지 않았다.

구글은 프로젝트 마리너(Project Mariner), 파이어베이스 테스팅 에이전트(Firebase Testing Agent), AI 모드 검색 등 내부 제품에 이미 활용하고 있다. 개발자는 구글 AI 스튜디오와 버텍스 AI의 제미나이 API를 통해 이 기능에 접근할 수 있으며, 브라우저베이스(Browserbase)가 호스팅하는 데모 환경에서 즉시 테스트할 수 있다.

구글은 악의적 사용, 예상치 못한 모델 동작, 프롬프트 주입 공격 등의 위험에 대응하기 위해 안전 기능을 모델에 직접 학습시키고 개발자에게 단계별 안전 서비스와 시스템 지침을 제공한다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

삼성, 멀미 완화 앱 '히어라피' 출시...이어폰으로 60초 들으면 2시간 효과

삼성이 이어폰으로 멀미를 완화하는 무료 앱 '히어라피'를 출시했다. 100Hz 저음 사인파를 60초간 들으면 최대 2시간 멀미 증상이 억제되며, 갤럭시 버즈4 프로 외 타사 이어폰에서도 사용 가능하다.

“남들 다 포기할 때 거꾸로 간다”… 토요타, 볼보·다임러와 ‘수소 동맹’ 전격 결성

세계 최대 자동차 기업 토요타가 전기차로 쏠린 업계 흐름에 맞서 수소 연료전지 시장에 승부수를 던졌다.

이란, 애플·구글·마이크로소프트 등 미국 기업 18곳 타격 경고

이란 혁명수비대(IRGC)가 애플·구글·마이크로소프트 등 미국 기업 18곳을 중동에서 타격하겠다고 경고했다. 4월 1일 오후 8시(테헤란 기준)를 데드라인으로 제시하며 직원 대피를 촉구했다.

음식 칼로리 계산하고 3개국어 번역까지… 메타, ‘진화한 스마트 안경’ 전격 공개”

메타가 레이밴(Ray-Ban)의 모회사 에실로룩소티카와 협력해 인공지능(AI) 기능을 대폭 강화한 차세대 스마트 안경 ‘옵틱스(Optics)’ 라인업을 선보였다.