앤스로픽 '클로드 오푸스 4' 공식 출시...7시간 연속 자율코딩·깃허브 코파일럿 통합

Anthropic officially launched its next-generation AI models Claude Opus 4 and Claude Sonnet 4, setting new standards for coding, advanced reasoning, and AI agents. Claude Opus 4 achieved recognition as the "world's best coding model," scoring 72.5% on SWE-bench and 43.2% on Terminal-bench while delivering sustained performance on complex, long-running tasks requiring thousands of steps over several hours. Claude Sonnet 4 represents a significant upgrade from Sonnet 3.7, achieving state-of-the-art 72.7% on SWE-bench while providing an optimal balance of performance and efficiency according to Anthropic. Both models are hybrid systems supporting instant responses and extended thinking modes, featuring extended thinking with tool use like web search, parallel tool execution, and dramatically improved memory capabilities when given access to local files. API pricing remains consistent with previous models at $15/$75 per million tokens (input/output) for Opus 4 and $3/$15 for Sonnet 4, with Sonnet 4 available to free users. Rakuten validated that Opus 4 independently performed a demanding open-source refactor for 7 hours with sustained performance, while GitHub announced Sonnet 4 as the base model for the new coding agent in GitHub Copilot. Anthropic implemented measures for higher AI Safety Levels including ASL-3 to minimize risk and maximize safety, alongside the general availability of Claude Code with native VS Code and JetBrains integrations expanding Claude's capabilities across development workflows.\

앤스로픽(Anthropic)이 차세대 AI 모델인 클로드 오푸스 4(Claude Opus 4)와 클로드 소넷 4(Claude Sonnet 4)를 공식 출시하며 코딩, 고급 추론, AI 에이전트 분야에서 새로운 표준을 제시했다고 발표했다.

클로드 오푸스 4는 "세계 최고의 코딩 모델"로 SWE-bench에서 72.5%, 터미널-벤치에서 43.2%를 기록해 업계 선도적 성능을 달성했으며, 수천 단계의 복잡한 장기 작업을 수 시간 동안 지속적으로 수행할 수 있다. 클로드 소넷 4는 기존 소넷 3.7의 대폭 업그레이드 버전으로 SWE-bench에서 72.7%의 최첨단 성능을 보이며 성능과 효율성의 최적 균형을 제공한다고 앤스로픽은 설명했다. 두 모델 모두 즉시 응답과 확장된 사고 모드를 지원하는 하이브리드 모델로, 웹 검색 등 도구 사용 중 확장된 사고 기능과 병렬 도구 실행이 가능하며 로컬 파일 접근 시 메모리 기능이 대폭 향상됐다.

API 가격은 오푸스 4가 입력/출력 토큰당 2만 1천원/10만 4천원(15달러/75달러), 소넷 4가 4천원/2만 1천원(3달러/15달러)으로 기존 모델과 동일하게 유지되며 무료 사용자도 소넷 4를 이용할 수 있다. 라쿠텐은 오푸스 4가 까다로운 오픈소스 리팩터링 작업을 7시간 동안 독립적으로 수행했다고 검증했으며, 깃허브는 소넷 4를 깃허브 코파일럿의 새로운 코딩 에이전트 기본 모델로 도입한다고 발표했다. 앤스로픽은 ASL-3 등 높은 AI 안전 수준 조치를 구현해 위험을 최소화하고 안전성을 극대화했으며, 클로드 코드(Claude Code)의 정식 출시와 함께 VS Code, JetBrains 네이티브 통합을 통해 개발 워크플로우 전반에 클로드의 역량을 확장했다고 밝혔다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

“우버 앱으로 호텔 예약하고 식당 잡는다”… 모빌리티 공룡 우버, 미국판 ‘위챗’ 꿈꾸며 영토 확장

세계 최대 모빌리티 플랫폼 우버가 단순한 차량 호출 서비스를 넘어 일상의 모든 서비스를 통합하는 ‘슈퍼 앱’으로의 전환에 속도를 내고 있다.

앤트로픽, 클로드의 ‘반란’ 원인은 인터넷 속 사악한 AI 묘사 때문

인공지능(AI)이 인간 엔지니어를 협박하는 충격적인 돌발 행동의 원인이 인터넷상에 퍼져 있는 ‘사악한 AI’ 시나리오 때문이라는 분석이 나왔다.

“열어둔 탭 100개도 순식간에 척척”… 애플, 사파리에 AI 기반 ‘자동 탭 정리’ 기능 탑재한다

애플이 수많은 웹페이지를 열어두는 사용자들을 위해 사파리 브라우저에 인공지능(AI) 기반의 자동 정리 기능을 전격 도입한다.

“내 얼굴이 왜 TV 박스에?”… 팝스타 두아 리파, 삼성전자에 200억 원대 ‘초상권’ 소송

세계적인 팝스타 두아 리파가 자신의 허락 없이 얼굴 사진을 제품 홍보에 사용했다며 삼성전자를 상대로 거액의 손해배상 청구 소송을 제기했다.