Artificial intelligence company OpenAI has unveiled a new AI tool called 'Operator' that can automatically manipulate web browsers. This tool is based on technology called 'Computer Using Agent (CUA)' and can interact with graphical user interfaces like humans do. Operator combines the visual capabilities of the GPT-4o model with advanced reasoning functions through reinforcement learning. This allows it to break down complex tasks into multiple steps and self-correct when problems occur. OpenAI has stated that this technology is still in its early stages. It is designed to hand over control to the user when sensitive information input is required, and to block harmful requests or unauthorized content. Currently, Operator is only available to ChatGPT Pro subscribers for $200 per month, and it can also be used on some corporate platforms such as Instacart.
인공지능 기업 오픈AI가 웹 브라우저를 자동으로 조작할 수 있는 새로운 AI 도구 '오퍼레이터(Operator)'를 공개했다. 이 도구는 '컴퓨터 사용 에이전트(CUA)'라는 기술을 기반으로 하며, 사람처럼 그래픽 사용자 인터페이스와 상호작용할 수 있다. 오퍼레이터는 GPT-4o 모델의 시각 능력과 강화 학습을 통한 고급 추론 기능을 결합했다. 이를 통해 복잡한 작업을 여러 단계로 나누고 문제 발생 시 자체 수정이 가능하다. 오픈 AI는 이 기술이 아직 초기 단계라고 밝혔다. 민감한 정보 입력이 필요한 경우 사용자에게 제어권을 넘기며, 해로운 요청이나 허용되지 않은 콘텐츠는 차단하도록 설계됐다. 현재 오퍼레이터는 월 200달러의 ChatGPT Pro 구독자에게만 제공되며, Instacart 등 일부 기업 플랫폼에서도 사용 가능하다.
