구글, 컴퓨터 사용 AI 에이전트 '제미나이 2.5 컴퓨터 유즈' 모델 공개

구글이 사용자 인터페이스와 직접 상호작용할 수 있는 제미나이 2.5 컴퓨터 유즈(Gemini 2.5 Computer Use) 모델을 공개 프리뷰로 출시했다.

이 모델은 제미나이 2.5 프로의 시각 이해와 추론 능력을 기반으로 웹페이지와 앱을 클릭, 입력, 스크롤하며 작동하는 AI 에이전트 구축을 지원한다. 온라인-마인드투웹(Online-Mind2Web), 웹보이저(WebVoyager), 안드로이드월드(AndroidWorld) 등 여러 벤치마크에서 경쟁 모델을 앞서며 가장 낮은 지연시간을 기록했다. 웹 브라우저 제어에 최적화됐으며 모바일 UI 제어에도 강력한 성능을 보이지만 데스크톱 OS 수준 제어는 아직 최적화되지 않았다.

구글은 프로젝트 마리너(Project Mariner), 파이어베이스 테스팅 에이전트(Firebase Testing Agent), AI 모드 검색 등 내부 제품에 이미 활용하고 있다. 개발자는 구글 AI 스튜디오와 버텍스 AI의 제미나이 API를 통해 이 기능에 접근할 수 있으며, 브라우저베이스(Browserbase)가 호스팅하는 데모 환경에서 즉시 테스트할 수 있다.

구글은 악의적 사용, 예상치 못한 모델 동작, 프롬프트 주입 공격 등의 위험에 대응하기 위해 안전 기능을 모델에 직접 학습시키고 개발자에게 단계별 안전 서비스와 시스템 지침을 제공한다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

메타, 직원 8,000명 해고…역대 최고 실적에도 AI 투자 위해 감원

메타가 5월 20일부터 전 직원의 10%인 8,000명을 감원한다. 역대 최고 분기 실적에도 AI 인프라 투자를 위한 결정으로, 직원 사기 급락과 내부 반발이 이어지고 있다.

탠스택 오픈소스 공급망 공격, 오픈AI까지 피해..."사용자 데이터는 안전"

오픈소스 라이브러리 탠스택을 겨냥한 공급망 공격으로 오픈AI 직원 기기 2대가 침해됐다. 사용자 데이터와 핵심 시스템은 안전하나 일부 소스코드가 탈취됐으며, 맥OS 앱 업데이트가 필요하다.

포드, 에너지 저장 사업 진출 선언...AI 데이터센터 특수 전환 기대감

포드가 에너지 저장 사업 진출을 선언한 후 이틀간 주가 21% 급등. 약 2조 8,960억원(20억 달러)을 투자해 켄터키 공장을 전환하고, 2027년 납품을 목표로 한다. 모건스탠리는 사업가치 약 100억 달러를 전망했다.

인텔, 애플 칩 시험 생산 착수…2027년 양산 목표

인텔이 애플 칩 위탁 생산 테스트를 시작했다. 밍치 궈 분석가에 따르면 2027년 양산을 목표로 18A-P 공정을 활용하며, 물량의 80%는 아이폰용이다. TSMC는 여전히 90% 이상 공급을 담당한다.