"간단한 작업은 OK", '챗GPT 아틀라스' 에이전트 모드 6가지 실전 테스트

테크 전문 미디어인 아스테크니카(Ars Technica)가 오픈AI의 신규 브라우저 챗GPT 아틀라스(ChatGPT Atlas)에 탑재된 '에이전트 모드'를 6가지 실제 작업으로 테스트한 결과, 10점 만점에 평균 6.83점, 중앙값 7.5점을 기록했다.

2048 게임 플레이(7점), 라디오 플레이리스트 자동 생성(9점), 이메일 연락처 수집(8점), 팬사이트 제작(7점), 전력 요금제 추천(9점) 등은 성공적이었으나, 스팀(Steam) 게임 데모 다운로드는 1점으로 완전히 실패했다. 가장 큰 문제는 '세션 길이의 기술적 제약'으로 대부분의 작업이 4~10분으로 제한돼 복잡한 업무를 완료하지 못했다는 점이다.

에이전트는 웹페이지를 해석하고 메뉴를 탐색하는 능력은 보였지만, 스팀 데모 다운로드 작업에서는 "has demo" 필터를 찾느라 수 분을 낭비한 뒤 무한 루프에 빠졌다.

위키 편집 요청은 "외부 웹사이트를 직접 편집할 수 없다"며 거부해 악의적 사용을 차단하는 안전장치도 확인됐다.

아스테크니카는 "간단하고 반복적인 작업을 사람이 점검할 수 있다면 유용하지만, '설정하고 잊어버리는' 백그라운드 자동화 도구로는 아직 신뢰할 수 없다"고 평가했다.

21일 맥OS용으로 출시된 아틀라스의 에이전트 모드는 유료 구독자(Plus, Pro, Business)만 사용할 수 있으며, 윈도우(Windows)와 모바일 버전은 추후 출시 예정이다.

앨리스

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

메타, 직원 8,000명 해고…역대 최고 실적에도 AI 투자 위해 감원

메타가 5월 20일부터 전 직원의 10%인 8,000명을 감원한다. 역대 최고 분기 실적에도 AI 인프라 투자를 위한 결정으로, 직원 사기 급락과 내부 반발이 이어지고 있다.

탠스택 오픈소스 공급망 공격, 오픈AI까지 피해..."사용자 데이터는 안전"

오픈소스 라이브러리 탠스택을 겨냥한 공급망 공격으로 오픈AI 직원 기기 2대가 침해됐다. 사용자 데이터와 핵심 시스템은 안전하나 일부 소스코드가 탈취됐으며, 맥OS 앱 업데이트가 필요하다.

포드, 에너지 저장 사업 진출 선언...AI 데이터센터 특수 전환 기대감

포드가 에너지 저장 사업 진출을 선언한 후 이틀간 주가 21% 급등. 약 2조 8,960억원(20억 달러)을 투자해 켄터키 공장을 전환하고, 2027년 납품을 목표로 한다. 모건스탠리는 사업가치 약 100억 달러를 전망했다.

인텔, 애플 칩 시험 생산 착수…2027년 양산 목표

인텔이 애플 칩 위탁 생산 테스트를 시작했다. 밍치 궈 분석가에 따르면 2027년 양산을 목표로 18A-P 공정을 활용하며, 물량의 80%는 아이폰용이다. TSMC는 여전히 90% 이상 공급을 담당한다.