구글, 로봇용 AI 학습모델 'RT-2' 출시

Google wants to make its robots smarter with the release of the AI learning model Robotic Transformer (RT-2). RT-2 is the new version of what the company calls its vision-language-action (VLA) model, which teaches robots to better recognize visual and language patterns, interpret instructions, and infer what objects work best for the request. Researchers tested RT-2 with a robotic arm in a kitchen office setting, asking it to decide what makes a good improvised hammer (it chose a rock) and to choose a drink to give to an exhausted person (it chose a Red Bull). The model was trained on web and robotics data, leveraging research advances in large language models like Google’s own Bard and combining it with robotic data (like which joints to move). Google's new robot is not perfect. The New York Times saw a live demo of the robot and reported that it incorrectly identified soda flavors and misidentified fruit as the color white.

구글은 로봇용 AI 학습모델인 Robotic Transformer (RT-2)를 출시했다. RT-2는 구글이 시각-언어-행동(VLA) 모델이라고 부르는 새로운 버전으로, 로봇이 시각적 언어 패턴을 더 잘 인식하고 지시사항을 해석하며, 요청에 가장 적합한 객체를 추론하도록 한다. 연구자들은 주방 사무실 환경에서 로봇 팔로 망치나 음료를 선택하는 행동을 테스트했다. 이 모델은 웹과 로봇 데이터에 대해 학습하였고, 구글의 Bard와 같은 대형언어모델의 연구 발전을 활용하여 로봇 데이터와 결합했다. 물론 뉴욕타임스는 로봇이 소다 맛을 잘못 식별하고, 과일을 흰색으로 잘못 식별하는 등 완벽하지 않다고 보도했다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

유튜브, ‘코첼라 2026’ 전 세계 무료 생중계

세계 최대 음악 축제인 ‘코첼라 밸리 뮤직 앤드 아츠 페스티벌(이하 코첼라)’을 안방에서 고화질로 즐길 수 있게 됐다.

머스크의 스페이스X, IPO 추진…xAI 합병·나스닥 편입 가능성까지

스페이스X가 SEC에 IPO 비공개 서류를 제출했다. 목표 조달액 750억 달러로 역대 최대 규모다. xAI 합병 리스크와 나스닥 100 자동 편입 가능성도 주목된다.

오픈AI, 애플 카플레이용 ‘AI 음성 비서’ 전격 출시

운전 중 스마트폰을 만지지 않고도 생성형 AI와 자유롭게 대화할 수 있는 시대가 열렸다. 1일(현지시간) 오픈AI는 애플의 차량용 인포테인먼트 시스템인 '카플레이(CarPlay)'에 챗GPT 음성 모드를 공식 지원한다고 밝혔다.

클라우드플레어, 워드프레스 대안 CMS '엠대시' 공개

클라우드플레어가 AI로 두 달 만에 개발한 오픈소스 CMS '엠대시'를 공개했다. 워드프레스 플러그인 보안 문제를 격리 샌드박스로 해결하고 AI 에이전트 관리 기능을 기본 탑재했다.