
AI 경쟁의 축이 다시 이동하고 있다. 생성형 AI 초기 경쟁이 더 좋은 답변, 더 긴 컨텍스트, 더 높은 벤치마크 점수를 둘러싼 모델 성능 싸움이었다면, 다음 경쟁은 AI가 실제 세계에서 무엇을 실행할 수 있는가로 옮겨가고 있다. 챗봇이 답을 생성하는 단계를 넘어, 로봇이 물리 공간에서 움직이고, 모바일 AI 에이전트가 앱과 데이터를 호출하며, 산업 장비와 차량, 스마트홈 기기가 AI 판단에 따라 작동하는 국면이 열리고 있는 것이다.
이 흐름에서 주목해야 할 키워드는 ‘행동의 OS’다. AI가 단순히 정보를 정리하는 도구를 넘어 실제 명령을 수행하려면, 모델만으로는 충분하지 않다. 로봇의 몸체를 움직이는 지능 계층, 스마트폰 안의 앱과 기능을 호출하는 운영체제, 이를 뒷받침하는 반도체·데이터센터·클라우드 인프라가 함께 필요하다.
이러한 상황에서 최근 새로운 소식은 주목할 만하다. 주요 외신은 지난 1일 메타가 로봇용 인공지능 모델을 개발하는 스타트업 어슈어드 로봇 인텔리전스(Assured Robot Intelligence, ARI)를 인수했다고 보도했다. 이에 따르면 ARI는 샌디에이고 기반 스타트업으로 휴머노이드 로봇이 인간 행동을 이해하고 예측하며 복잡한 환경에 적응하도록 하는 AI 모델을 개발해 왔다.
외신 보도를 종합하면 ARI는 로봇이 사람의 행동과 주변 환경을 해석하고 상황에 맞춰 움직이도록 하는 지능 계층에 개발에 주력하고 있다. 즉 메타의 관심은 휴머노이드 로봇 한 대를 직접 만드는 것보다, 여러 형태의 로봇 위에서 작동할 수 있는 로봇용 운영 지능을 선점하는 데 있다고 볼 수 있다.
이번 인수를 통해 예측할 수 있는 부분은, 메타가 다음 전장으로 보는 지점이 메타버스를 대체하는 로봇이라기보다, 가상·모바일·웨어러블 접점 너머의 ‘피지컬 AI’로 확장되는 플랫폼이라는 것이다. 결국 메타는 하드웨어 확보보다 ‘로봇의 두뇌’ 확보에 나선 셈이다. 이는 엔비디아와 구글 딥마인드의 로봇용 파운데이션 모델 경쟁, 유럽연합의 안드로이드 상호운용성 조치 등과 맥락이 닿아 있다.
로봇 경쟁의 중심, 하드웨어에서 ‘AI 브레인’으로 이동

메타의 ARI 인수는 고립된 사건이 아니다. 이미 엔비디아와 구글 딥마인드는 로봇 AI의 기반 모델을 둘러싼 경쟁에 뛰어들었다. 엔비디아는 지난 2024년 3월 휴머노이드 로봇 개발을 위한 프로젝트 그루트(Project GR00T)와 아이작 로보틱스 플랫폼 업데이트를 발표했다. 이어 지난해 3월에는 개방형 휴머노이드 로봇 파운데이션 모델인 아이작 그루트 N1(Isaac GR00T N1)을 공개했다. 엔비디아는 이 모델을 언어 지시를 이해하고 다양한 작업을 수행하는 범용 휴머노이드 로봇 개발을 가속하기 위한 기반 모델로 설명했다.
구글 딥마인드 역시 제미나이 로보틱스 1.5(Gemini Robotics 1.5)를 공개하며 로봇용 비전·언어·행동 모델 경쟁에 뛰어들었다. 딥마인드는 제미나이 로보틱스 모델이 로봇의 형태와 크기에 관계없이 주변을 인식하고, 추론하고, 도구를 사용하며, 인간과 상호작용할 수 있도록 설계됐다고 설명한다. 이는 로봇 AI가 특정 장비에 종속된 제어 소프트웨어를 넘어, 다양한 로봇 몸체에 적용 가능한 ‘범용 행동 모델’로 진화하고 있음을 보여준다.
이 흐름에서 메타의 ARI 인수는 단순한 로봇 스타트업 인수라기보다, 메타식 플랫폼 전략이 물리 세계의 실행 계층으로 확장되는 신호로 읽힌다. 메타는 소셜 네트워크, 모바일 광고, VR·AR 기기, 스마트 글래스, 생성형 AI를 거치며 사용자의 디지털 경험을 둘러싼 접점을 넓혀왔다. 이제 그 접점은 화면과 헤드셋을 넘어 물리 공간으로 확장되고 있다.
로봇이 가정, 물류, 제조, 의료, 보안 영역으로 들어가면 경쟁의 핵심은 모터나 관절만이 아니다. 로봇이 무엇을 보고, 어떻게 판단하며, 어떤 행동을 선택하는가가 더 중요해진다. 피지컬 AI 경쟁에서 ‘몸체’는 진입점일 수 있지만, 장기적인 플랫폼 주도권은 로봇의 판단과 행동을 통제하는 운영 지능에서 나올 가능성이 크다.
안드로이드도 AI 에이전트의 실행 기반으로 바뀐다

같은 시기 모바일 OS에서도 유사한 변화가 나타나고 있다. 유럽연합 집행위원회는 지난달 27일 알파벳의 구글 안드로이드와 관련해 디지털시장법(DMA)상 상호운용성 의무를 이행하기 위한 예비 판단과 초안 조치를 제시했다. 이 조치는 경쟁 AI 서비스가 안드로이드 기기에서 앱과 기능에 효과적으로 접근하고, 사용자의 선택에 따라 이메일 발송, 음식 주문, 사진 공유 같은 작업을 수행할 수 있도록 하는 방안을 담고 있다. 다만 이는 최종 명령이 아니라 의견수렴 단계의 예비 조치안이다. 집행위원회는 관련 의견을 받은 뒤 최종 결정을 내릴 예정이다.
이는 안드로이드가 단순한 앱 실행 환경을 넘어 AI 에이전트의 실행 기반으로 바뀌고 있음을 보여준다. 과거 모바일 OS 경쟁은 앱 생태계, 개발자 도구, 결제, 검색 기본값을 둘러싸고 벌어졌다. 그러나 AI 비서가 사용자의 이메일을 읽고, 일정을 조정하고, 앱 기능을 대신 실행하는 단계로 진입하면 OS의 역할은 달라진다. OS는 앱을 여는 도구가 아니라, AI가 앱과 데이터, 기기 기능을 호출해 실제 작업을 수행하는 실행 계층이 된다.
드리미의 스마트폰 실험도 이 변화를 보여주는 보조 사례다. 더버지에 따르면 지난 5월 2일 중국 로봇청소기 기업 드리미가 캘리포니아 행사에서 오로라 넥스 LS1(Aurora Nex LS1)과 오로라 럭스(Aurora Lux) 스마트폰을 공개했다고 보도했다. 다만 이 제품들이 아직 정식 출시된 것은 아니며, 안드로이드 기반 자체 시스템인 오로라 AIOS(Aurora AIOS)를 강조하고 있다고 전했다.
드리미 측은 오로라 AIOS를 사용자의 명령을 기다리는 방식이 아니라 습관을 학습하고 선제적으로 행동하는 운영체제로 소개했다. 다만 이 부분은 회사 발표에 가까운 만큼 실제 제품 경쟁력과 시장 수용성은 출시 이후 검증이 필요하다.
중요한 것은 드리미 스마트폰 자체의 성공 여부보다, 스마트폰 제조사와 플랫폼 기업들이 OS를 AI 실행 계층으로 재해석하기 시작했다는 점이다. AI 에이전트가 사용자의 의도를 이해하고 앱을 조합해 업무를 수행하려면, 운영체제는 더 많은 기능 접근권과 상호운용성을 제공해야 한다. 반대로 플랫폼 기업 입장에서는 이 실행 권한을 누가 장악하느냐가 차세대 모바일 경쟁의 핵심이 된다.
승자는 ‘더 똑똑한 AI’가 아니라 ‘현실을 움직이는 AI’다

이 모든 흐름을 묶는 키워드는 ‘실행력’이다. 생성형 AI의 1차 경쟁이 더 자연스러운 답변, 더 긴 문맥 처리, 더 높은 추론 성능이었다면, 다음 경쟁은 AI가 실제 세계에서 무엇을 할 수 있는가로 옮겨가고 있다. 휴머노이드 로봇은 공장과 물류센터, 가정과 상업 공간에서 물리적 행동을 수행해야 한다. 모바일 AI 에이전트는 스마트폰 안의 앱과 데이터, 결제와 메시지, 일정과 업무 도구를 연결해야 한다. 차량과 산업 장비, 스마트홈 기기 역시 AI가 판단하고 제어하는 실행 계층을 필요로 한다.
이 경쟁의 또 다른 특징은 막대한 자본 지출을 동반한다는 점이다. 메타는 2026년 1분기 실적 발표에서 올해 자본지출 전망을 기존 1150억~1350억달러(약 169조 6800억원~199조 1900억원)에서 1250억~1450억달러로 상향했다. 회사는 부품 가격 상승과 향후 데이터센터 용량 확보 비용을 이유로 들었다. 이와 관련 로이터는 같은 주 메타가 AI 인프라 투자 확대에 대응하기 위해 250억달러 규모의 채권 발행을 추진했다는 소식을 알리기도 했다.
결국 AI 경쟁의 구조는 세 갈래로 재편되고 있다. 첫째는 모델을 만드는 기업이다. 둘째는 모델을 구동할 반도체, 클라우드, 데이터센터, 전력 인프라를 확보한 기업이다. 셋째는 AI가 현실의 행동으로 이어지는 OS와 실행 계층을 장악한 기업이다. 종합하자면 현재 전략적 가치가 빠르게 커지는 영역은 세 번째다. 사용자의 명령이 앱 실행으로 이어지고, 로봇의 움직임으로 구현되며, 차량과 공장 설비를 제어하는 순간 AI는 챗봇이 아니라 물리 세계의 운영체제에 가까워지기 때문이다.
따라서 메타의 ARI 인수는 휴머노이드 로봇 한 대를 만들기 위한 이벤트라기보다 차세대 플랫폼 전쟁의 신호라고 할 수 있다. 모바일 시대의 승자가 iOS와 안드로이드를 장악한 기업이었다면, 피지컬 AI 시대의 승자는 로봇과 기기, 차량, 산업 시스템 위에서 작동하는 ‘행동의 OS’를 장악한 기업이 될 가능성이 크기 때문이다. 즉 앞으로의 이 분야에서 승부를 가를 질문은 “어떤 AI가 더 똑똑한가”가 아니다. “어떤 AI가 현실을 더 안정적으로, 더 넓게, 더 안전하게 움직일 수 있는가”가 될 듯하다.
