앤트로픽 클로드 오푸스 4.1 출시, 코딩 벤치마크 74.5% 최고 기록

Anthropic released Claude Opus 4.1 on August 5, 2025, ahead of OpenAI's anticipated GPT-5 launch. The upgraded model achieved a record 74.5% score on SWE-bench Verified, topping coding benchmarks. This represents a 2-point improvement over Opus 4 and 5-point lead over OpenAI's o-series models. Claude Opus 4.1 shows enhanced code refactoring, data analysis, and agentic task capabilities. Anthropic recommends all users upgrade from Opus 4 to 4.1 at the same pricing. The model uses API tag claude-opus-4-1-20250805 for developer access. Anthropic promises "substantially larger" improvements in coming weeks.

앤트로픽이 2025년 8월 5일 오픈AI의 GPT-5 출시에 대비해 업그레이드된 클로드 오푸스 4.1 모델을 출시했다. 새 모델은 SWE-벤치 베리파이드(SWE-bench Verified) 벤치마크에서 74.5%의 최고 점수를 기록하며 코딩 분야 1위를 차지했다. 이는 기존 오푸스 4보다 2포인트, 오픈AI의 o시리즈보다 5포인트 높은 성과다. 클로드 오푸스 4.1은 코드 리팩터링, 데이터 분석, 에이전틱 작업 능력이 크게 향상됐다. 앤트로픽은 모든 사용자에게 기존 오푸스 4에서 4.1로 업그레이드할 것을 권장한다고 밝혔다. 가격은 기존 오푸스 4와 동일하게 유지되며 API 태그는 claude-opus-4-1-20250805를 사용한다. 앤트로픽은 향후 몇 주 내에 "상당히 큰" 개선사항을 추가로 공개할 예정이라고 예고했다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

유튜브, ‘코첼라 2026’ 전 세계 무료 생중계

세계 최대 음악 축제인 ‘코첼라 밸리 뮤직 앤드 아츠 페스티벌(이하 코첼라)’을 안방에서 고화질로 즐길 수 있게 됐다.

머스크의 스페이스X, IPO 추진…xAI 합병·나스닥 편입 가능성까지

스페이스X가 SEC에 IPO 비공개 서류를 제출했다. 목표 조달액 750억 달러로 역대 최대 규모다. xAI 합병 리스크와 나스닥 100 자동 편입 가능성도 주목된다.

오픈AI, 애플 카플레이용 ‘AI 음성 비서’ 전격 출시

운전 중 스마트폰을 만지지 않고도 생성형 AI와 자유롭게 대화할 수 있는 시대가 열렸다. 1일(현지시간) 오픈AI는 애플의 차량용 인포테인먼트 시스템인 '카플레이(CarPlay)'에 챗GPT 음성 모드를 공식 지원한다고 밝혔다.

클라우드플레어, 워드프레스 대안 CMS '엠대시' 공개

클라우드플레어가 AI로 두 달 만에 개발한 오픈소스 CMS '엠대시'를 공개했다. 워드프레스 플러그인 보안 문제를 격리 샌드박스로 해결하고 AI 에이전트 관리 기능을 기본 탑재했다.