앤트로픽의 클로드 3, 평가테스트서 GPT-4 능가

For the first time, Anthropic's Claude 3 large language model (LLM) has outperformed OpenAI's GPT-4 on Chatbot Arena, a crowdsourced leaderboard. This marks a significant moment as variations of GPT-4 have consistently topped the chart since its inclusion. The success of Claude 3, along with Anthropic's smaller model Haiku, suggests a shift in the AI language model landscape, with top models now coming from a vendor other than OpenAI. The Chatbot Arena, operated by the Large Model Systems Organization, allows users to rate outputs from different LLMs, offering a platform to gauge AI models' effectiveness beyond traditional benchmarks. The competition among LLMs, including Google's Gemini Advanced, signifies a vibrant and evolving AI assistant space, with OpenAI expected to release a new successor to GPT-4 Turbo later this year.

엔트로픽의 클로드 3(Claude 3) 대규모언어모델(LLM)이 처음으로 챗봇 아레나(Chatbot Arena)에서 오픈AI의 GPT-4를 능가했다. 이는 지난 1년 넘게 챗봇 아레나의 정상 자리를 지켜온 GPT-4의 패배를 의미하며, 앤트로픽의 클로드 3가 더 자연스럽고 매력적인 대화를 수행할 수 있다는 것을 보여준다. 대규모모델 시스템 조직(Large Model Systems Organization)이 운영하는 챗봇 아레나는 사용자가 다양한 LLM의 출력을 평가하게 하여 전통적인 벤치마크를 넘어서 AI 모델의 효과를 가늠할 수 있는 플랫폼이다. 구글의 제머나이 어드밴스를 포함한 LLM 간의 경쟁이 치열해지며 오픈AI는 올해 후반에 GPT-4 Turbo의 새로운 후속 모델을 출시할 것으로 예상된다.

“The king is dead”—Claude 3 surpasses GPT-4 on Chatbot Arena for the first time

앨리스

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

모질라, 왓츠앱에 선거 사전 가짜뉴스 방지 촉구

In 2024, nearly 4 billion people, or half the world's population, will vote in 64 countries around the world. This includes major democracies like the United States and India.

EU, 애플의 NFC 개방 계획 승인 예정

the European Commission is poised to greenlight Apple's previously announced policy changes regarding access to the NFC chip on the iPhone, aimed at fostering competition in the contactless payments market.

IBM, 인프라 관리 툴 선두주자 해시코프 인수 추진

IBM, the global cloud and mainframe company, has agreed to acquire infrastructure management tools provider HashiCorp.

메타, 한정판 헤드셋으로 '퀘스트' 생태계 확장

Meta has announced partnerships with several manufacturers, including Microsoft, Asus ROG, and Lenovo, to bring a variety of limited-edition mixed reality headsets to market.