Amazon has unveiled a new AI model, Nova Act, capable of performing tasks in a web browser on behalf of users. This development intensifies competition with companies like OpenAI and Anthropic. Nova Act is designed to help developers create AI agents that can autonomously execute multi-step tasks. Amazon demonstrated its functionality by showcasing an example where the tool searches for "apartments within biking distance to the train station." The development of AI agents is becoming a central focus in the AI industry, surpassing traditional text and image generation technologies. Anthropic released its "Computer Use" tool last October, enabling AI to navigate screens, click buttons, and perform real-time tasks. OpenAI followed with "Operator" in January, automating tasks like vacation planning and restaurant reservations, and later introduced "Deep Research" for generating detailed reports in February. Nova Act is currently available as a research preview for developers, alongside a website where users can explore Amazon's Nova AI models. This release aligns with Amazon's broader strategy to expand its presence in generative AI technology.
아마존이 사용자를 대신해 웹 브라우저에서 작업을 수행할 수 있는 새로운 AI 모델 'Nova Act'를 공개했다. 이로써 아마존은 OpenAI, Anthropic 등과의 경쟁에서 한층 더 치열한 구도를 형성하게 됐다. Nova Act는 개발자들이 다단계 작업을 자동으로 수행할 수 있는 AI 에이전트를 구축할 수 있도록 설계된 도구다. 아마존은 Nova Act를 활용해 "기차역까지 자전거로 이동 가능한 거리의 아파트 검색"과 같은 작업을 수행하는 예시를 공개하며 그 가능성을 시연했다. AI 에이전트 개발은 텍스트와 이미지 생성기를 넘어서는 새로운 AI 기술 경쟁의 중심이 되고 있다. Anthropic은 지난해 10월 컴퓨터 화면을 해석하고 버튼 클릭, 텍스트 입력, 웹사이트 탐색 등 다양한 작업을 수행할 수 있는 'Computer Use' 도구를 선보였으며, OpenAI는 올해 초 휴가 계획, 양식 작성, 레스토랑 예약 등을 자동화하는 'Operator'를 출시했다. 이어 2월에는 복잡한 연구 보고서를 작성하고 사용자가 요청한 주제를 분석할 수 있는 'Deep Research' 도구도 공개했다. 아마존은 Nova Act를 연구용 미리 보기 형태로 먼저 출시하며, 사용자들이 Nova AI 모델을 실험해볼 수 있는 웹사이트도 함께 제공한다는 방침이다.
