구글, 로봇용 AI 학습모델 'RT-2' 출시

Google wants to make its robots smarter with the release of the AI learning model Robotic Transformer (RT-2). RT-2 is the new version of what the company calls its vision-language-action (VLA) model, which teaches robots to better recognize visual and language patterns, interpret instructions, and infer what objects work best for the request. Researchers tested RT-2 with a robotic arm in a kitchen office setting, asking it to decide what makes a good improvised hammer (it chose a rock) and to choose a drink to give to an exhausted person (it chose a Red Bull). The model was trained on web and robotics data, leveraging research advances in large language models like Google’s own Bard and combining it with robotic data (like which joints to move). Google's new robot is not perfect. The New York Times saw a live demo of the robot and reported that it incorrectly identified soda flavors and misidentified fruit as the color white.

구글은 로봇용 AI 학습모델인 Robotic Transformer (RT-2)를 출시했다. RT-2는 구글이 시각-언어-행동(VLA) 모델이라고 부르는 새로운 버전으로, 로봇이 시각적 언어 패턴을 더 잘 인식하고 지시사항을 해석하며, 요청에 가장 적합한 객체를 추론하도록 한다. 연구자들은 주방 사무실 환경에서 로봇 팔로 망치나 음료를 선택하는 행동을 테스트했다. 이 모델은 웹과 로봇 데이터에 대해 학습하였고, 구글의 Bard와 같은 대형언어모델의 연구 발전을 활용하여 로봇 데이터와 결합했다. 물론 뉴욕타임스는 로봇이 소다 맛을 잘못 식별하고, 과일을 흰색으로 잘못 식별하는 등 완벽하지 않다고 보도했다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

"구글 AI 오버뷰, 10번 중 1번 오답…출처 56%는 검증 불가"

구글 AI 오버뷰가 10번 중 1번 오답을 낸다는 연구 결과가 나왔다. 뉴욕타임스와 AI 스타트업 우미의 공동 조사에서 제미나이 3 기준 정확도는 91%지만, 정답의 56%는 출처로 검증이 불가능한 것으로 드러났다.

메타 전 직원, 이용자 비밀 사진 3만 장 ‘슬쩍’

글로벌 IT 기업 메타(Meta)의 전직 직원이 페이스북 이용자들의 비공개 사진 수만 장을 불법으로 빼돌린 혐의로 영국 수사 당국의 조사를 받고 있다.

“머스크의 칩 독립 선언”… 인텔, 초거대 AI 생산 기지 ‘테라팹’ 건설 전격 합류

일론 머스크의 인공지능(AI) 야망을 실현할 초대형 반도체 생산 시설 건설에 ‘반도체 거인’ 인텔이 구원투수로 등판한다.

블룸버그 "아이폰 폴드, 9월 출시 예정대로"…닛케이 지연설 정면 반박

블룸버그 마크 거먼이 아이폰 폴드의 9월 출시 일정이 유지되고 있다고 보도하며 닛케이아시아의 지연설을 반박했다. 초기 물량 부족 가능성은 인정했지만, 아이폰 18 프로와 동시 공개 계획은 그대로라고 전했다.