마이크로소프트, 코파일럿 스튜디오에 '컴퓨터 사용' 기능 도입… 웹사이트·앱 자동화 가능

Microsoft has implemented a new "computer use" feature for Copilot Studio this week that enables AI agents to interact with websites and desktop applications as if they were tools for automating tasks. This new capability mirrors similar functionalities like OpenAI's Operator or Claude's identically named "computer use" feature, allowing businesses to build AI agents that can manipulate websites and desktop applications just like a human user would. Charles Lamanna, corporate vice president of Microsoft's business & industry Copilot, explained that "Computer use enables agents to interact with websites and desktop apps by clicking buttons, selecting menus, and typing into fields on the screen," which facilitates task handling even without direct API connections to the system. Copilot Studio will be capable of creating AI agents that can automate various tasks including data entry, market research, and invoice processing, with Microsoft claiming that this new tool can detect changes in buttons and screens within apps or websites and continue working without failures or interruptions. Microsoft recently added a similar feature called Actions to its consumer Copilot earlier this month, allowing users to have Copilot perform background tasks such as booking restaurant reservations, purchasing event tickets, and buying items from online stores while users focus on other activities. While the Actions experience in consumer Copilot is limited to specific partners, it appears that Copilot Studio will have broader compatibility with more websites and applications. This advancement represents another significant step in Microsoft's efforts to integrate AI automation capabilities into its business and productivity offerings.

마이크로소프트가 코파일럿 스튜디오에 AI가 웹사이트와 앱을 직접 조작하는 '컴퓨터 사용(Computer Use)' 기능을 추가했다. 이 기능은 AI가 버튼을 클릭하고 메뉴를 선택하며 필드에 텍스트를 입력하는 등 사람처럼 시스템을 조작할 수 있게 해준다. 오픈AI의 오퍼레이터나 앤트로픽의 클로드의 유사 기능과 비슷하게, API가 없어도 사용자처럼 앱을 사용할 수 있다는 점이 핵심이다. 마이크로소프트 부사장 찰스 라만나는 "API 연결 없이도 사람이 앱을 사용할 수 있다면 AI 에이전트도 사용할 수 있다"고 설명했다. 이를 통해 기업들은 데이터 입력, 시장 조사, 인보이스 처리 등을 자동화하는 AI 에이전트를 만들 수 있다. 이 도구는 앱이나 웹사이트의 화면이 변경되어도 이를 감지하고 작업을 계속할 수 있다. 마이크로소프트는 이미 소비자용 코파일럿에도 레스토랑 예약이나 쇼핑 등을 수행하는 '액션' 기능을 추가했다. 소비자용 코파일럿의 액션은 일부 파트너로 제한되지만, 코파일럿 스튜디오는 더 많은 웹사이트와 앱에서 작동할 것으로 보인다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

메타, 직원 8,000명 해고…역대 최고 실적에도 AI 투자 위해 감원

메타가 5월 20일부터 전 직원의 10%인 8,000명을 감원한다. 역대 최고 분기 실적에도 AI 인프라 투자를 위한 결정으로, 직원 사기 급락과 내부 반발이 이어지고 있다.

탠스택 오픈소스 공급망 공격, 오픈AI까지 피해..."사용자 데이터는 안전"

오픈소스 라이브러리 탠스택을 겨냥한 공급망 공격으로 오픈AI 직원 기기 2대가 침해됐다. 사용자 데이터와 핵심 시스템은 안전하나 일부 소스코드가 탈취됐으며, 맥OS 앱 업데이트가 필요하다.

포드, 에너지 저장 사업 진출 선언...AI 데이터센터 특수 전환 기대감

포드가 에너지 저장 사업 진출을 선언한 후 이틀간 주가 21% 급등. 약 2조 8,960억원(20억 달러)을 투자해 켄터키 공장을 전환하고, 2027년 납품을 목표로 한다. 모건스탠리는 사업가치 약 100억 달러를 전망했다.

인텔, 애플 칩 시험 생산 착수…2027년 양산 목표

인텔이 애플 칩 위탁 생산 테스트를 시작했다. 밍치 궈 분석가에 따르면 2027년 양산을 목표로 18A-P 공정을 활용하며, 물량의 80%는 아이폰용이다. TSMC는 여전히 90% 이상 공급을 담당한다.