오픈AI가 7월 17일 챗GPT 에이전트(ChatGPT Agent)를 출시하며 AI가 독립적으로 복잡한 작업을 수행할 수 있는 통합 에이전트 시스템을 선보였다.
이 시스템은 오퍼레이터(Operator)의 웹사이트 상호작용 능력, 딥 리서치(Deep Research)의 정보 종합 기능, 그리고 챗GPT의 대화형 지능을 하나로 결합했다. 챗GPT 에이전트는 자체 가상 컴퓨터를 사용해 "일정 확인 후 최근 뉴스 기반 고객 미팅 브리핑", "4인용 일본식 아침식사 재료 계획 및 구매", "경쟁사 3곳 분석 후 슬라이드 제작" 등의 복잡한 업무를 처리할 수 있다. 이 AI는 웹사이트 탐색, 결과 필터링, 보안 로그인 요청, 코드 실행, 분석 수행, 편집 가능한 슬라이드쇼와 스프레드시트 제공까지 가능하다.
투자은행 애널리스트 모델링 작업을 측정하는 내부 벤치마크에서 챗GPT 에이전트는 딥 리서치와 o3 모델을 크게 앞섰으며, 웹 브라우징 에이전트 벤치마크인 브라우즈컴프(BrowseComp)에서 68.9%의 새로운 최고 성능을 기록했다. 프로(Pro) 사용자는 당일 내 접근 가능하며 월 400개 메시지, 플러스(Plus)와 팀(Team) 사용자는 며칠 내 접근으로 월 40개 메시지를 이용할 수 있다. 기업과 교육 사용자는 향후 몇 주 내 접근 가능하며, 유럽경제지역과 스위스는 별도 일정으로 제공될 예정이다.
OpenAI launched ChatGPT Agent on July 17, introducing a unified agentic system that enables AI to independently perform complex tasks using its own virtual computer. The system integrates Operator's website interaction capabilities, Deep Research's information synthesis skills, and ChatGPT's conversational intelligence into one cohesive platform. ChatGPT Agent can handle complex requests such as "look at my calendar and brief me on upcoming client meetings based on recent news," "plan and buy ingredients to make Japanese breakfast for four," and "analyze three competitors and create a slide deck." The AI can intelligently navigate websites, filter results, prompt secure logins, run code, conduct analysis, and deliver editable slideshows and spreadsheets. On internal benchmarks measuring investment banking analyst modeling tasks, ChatGPT Agent significantly outperformed Deep Research and o3 models, while achieving a new state-of-the-art 68.9% on BrowseComp, a web browsing agent benchmark. Pro users receive access by end of day with 400 monthly messages, while Plus and Team users get access over the next few days with 40 monthly messages. Enterprise and Education users will gain access in the coming weeks, with European Economic Area and Switzerland availability to be determined separately.
