마이크로소프트, 코파일럿 스튜디오에 '컴퓨터 사용' 기능 도입… 웹사이트·앱 자동화 가능

Microsoft has implemented a new "computer use" feature for Copilot Studio this week that enables AI agents to interact with websites and desktop applications as if they were tools for automating tasks. This new capability mirrors similar functionalities like OpenAI's Operator or Claude's identically named "computer use" feature, allowing businesses to build AI agents that can manipulate websites and desktop applications just like a human user would. Charles Lamanna, corporate vice president of Microsoft's business & industry Copilot, explained that "Computer use enables agents to interact with websites and desktop apps by clicking buttons, selecting menus, and typing into fields on the screen," which facilitates task handling even without direct API connections to the system. Copilot Studio will be capable of creating AI agents that can automate various tasks including data entry, market research, and invoice processing, with Microsoft claiming that this new tool can detect changes in buttons and screens within apps or websites and continue working without failures or interruptions. Microsoft recently added a similar feature called Actions to its consumer Copilot earlier this month, allowing users to have Copilot perform background tasks such as booking restaurant reservations, purchasing event tickets, and buying items from online stores while users focus on other activities. While the Actions experience in consumer Copilot is limited to specific partners, it appears that Copilot Studio will have broader compatibility with more websites and applications. This advancement represents another significant step in Microsoft's efforts to integrate AI automation capabilities into its business and productivity offerings.

마이크로소프트가 코파일럿 스튜디오에 AI가 웹사이트와 앱을 직접 조작하는 '컴퓨터 사용(Computer Use)' 기능을 추가했다. 이 기능은 AI가 버튼을 클릭하고 메뉴를 선택하며 필드에 텍스트를 입력하는 등 사람처럼 시스템을 조작할 수 있게 해준다. 오픈AI의 오퍼레이터나 앤트로픽의 클로드의 유사 기능과 비슷하게, API가 없어도 사용자처럼 앱을 사용할 수 있다는 점이 핵심이다. 마이크로소프트 부사장 찰스 라만나는 "API 연결 없이도 사람이 앱을 사용할 수 있다면 AI 에이전트도 사용할 수 있다"고 설명했다. 이를 통해 기업들은 데이터 입력, 시장 조사, 인보이스 처리 등을 자동화하는 AI 에이전트를 만들 수 있다. 이 도구는 앱이나 웹사이트의 화면이 변경되어도 이를 감지하고 작업을 계속할 수 있다. 마이크로소프트는 이미 소비자용 코파일럿에도 레스토랑 예약이나 쇼핑 등을 수행하는 '액션' 기능을 추가했다. 소비자용 코파일럿의 액션은 일부 파트너로 제한되지만, 코파일럿 스튜디오는 더 많은 웹사이트와 앱에서 작동할 것으로 보인다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

“우버 앱으로 호텔 예약하고 식당 잡는다”… 모빌리티 공룡 우버, 미국판 ‘위챗’ 꿈꾸며 영토 확장

세계 최대 모빌리티 플랫폼 우버가 단순한 차량 호출 서비스를 넘어 일상의 모든 서비스를 통합하는 ‘슈퍼 앱’으로의 전환에 속도를 내고 있다.

앤트로픽, 클로드의 ‘반란’ 원인은 인터넷 속 사악한 AI 묘사 때문

인공지능(AI)이 인간 엔지니어를 협박하는 충격적인 돌발 행동의 원인이 인터넷상에 퍼져 있는 ‘사악한 AI’ 시나리오 때문이라는 분석이 나왔다.

“열어둔 탭 100개도 순식간에 척척”… 애플, 사파리에 AI 기반 ‘자동 탭 정리’ 기능 탑재한다

애플이 수많은 웹페이지를 열어두는 사용자들을 위해 사파리 브라우저에 인공지능(AI) 기반의 자동 정리 기능을 전격 도입한다.

“내 얼굴이 왜 TV 박스에?”… 팝스타 두아 리파, 삼성전자에 200억 원대 ‘초상권’ 소송

세계적인 팝스타 두아 리파가 자신의 허락 없이 얼굴 사진을 제품 홍보에 사용했다며 삼성전자를 상대로 거액의 손해배상 청구 소송을 제기했다.