구글 딥마인드, '제미나이 로보틱스-ER 1.6' 공개…산업용 계기 판독 성공률 93%

구글 딥마인드가 로봇이 물리적 환경을 더 정밀하게 이해하고 판단할 수 있도록 설계된 AI 모델 '제미나이 로보틱스-ER 1.6(Gemini Robotics-ER 1.6)'을 공개하고, 같은 날 제미나이 API와 구글 AI 스튜디오를 통해 개발자에게 제공하기 시작했다.

이 모델은 공간 추론, 작업 계획, 작업 완료 여부 감지 등 로봇에 특화된 추론 기능을 전작인 ER 1.5와 제미나이 3.0 플래시 대비 전 영역에서 크게 개선했다.

특히 이번 버전에서 새로 추가된 '계기 판독' 기능은 보스턴 다이내믹스와의 협력으로 발굴된 기능으로, 로봇이 압력계·액위계·디지털 계기판 등 산업 현장의 각종 계기를 스스로 읽고 해석할 수 있게 해준다. 계기 판독 성능 테스트에서 ER 1.5가 성공률 23%에 그친 반면, ER 1.6은 86%, '에이전틱 비전' 적용 시 93%를 기록했다.

보스턴 다이내믹스의 로봇 스팟이 현장을 순회하며 촬영한 계기 이미지를 ER 1.6이 분석하는 방식으로 실제 산업 현장에 적용된다. 안전성 측면에서도 이전 세대 모델 대비 물리적 제약 준수 능력이 크게 향상됐으며, 텍스트 기반 부상 위험 인식에서 제미나이 3.0 플래시보다 6%, 영상 기반에서는 10% 높은 성능을 보였다.

딥마인드는 특정 분야에서 성능이 부족한 경우 레이블링된 이미지 10~50장을 제출하면 협력해 기능을 개선하겠다고 밝히며 로봇공학 커뮤니티와의 적극적인 협업 의사를 드러냈다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

“웹에서도 쪽지 보낸다”… 메타, 스레드(Threads) PC판 대수술로 ‘X’ 정조준

메타가 자사 소셜미디어 플랫폼 ‘스레드(Threads)’의 웹 버전을 전면 개편하며 사용자 편의성 강화에 나섰다. 그동안 모바일 앱에만 치중했던 서비스 무게중심을 PC 환경으로 확장해 경쟁 플랫폼인 ‘X(옛 트위터)’와의 격차를 벌리겠다는 전략이다.

"이제 AI가 내 맥(Mac)에서 일한다"… 퍼플렉시티, '24시간 무인 에이전트' 전격 출시

AI 검색 엔진의 선두주자 퍼플렉시티(Perplexity)가 사용자 대신 컴퓨터를 직접 조작해 복잡한 업무를 수행하는 맥(Mac) 전용 AI 비서 '퍼스널 컴퓨터(Personal Computer)'를 선보였다.

오픈AI 코덱스 대규모 업데이트...백그라운드 컴퓨터 사용 기능 추가

오픈AI가 코덱스 데스크톱을 대폭 업그레이드했다. 맥 앱 자율 조작, GPT 이미지 생성, 메모리 기능, 111개 플러그인 추가. 클로드 코드에 맞서는 AI 코딩 에이전트 전쟁이 가열되고 있다.

"쇼츠 지옥서 탈출한다"… 유튜브, 시청 제한 '0분' 설정 전격 도입

유튜브가 모바일 앱 피드에서 숏폼 콘텐츠인 '쇼츠(Shorts)'를 완전히 차단할 수 있는 기능을 전격 도입했다.