앤트로픽의 클로드 3, 평가테스트서 GPT-4 능가

For the first time, Anthropic's Claude 3 large language model (LLM) has outperformed OpenAI's GPT-4 on Chatbot Arena, a crowdsourced leaderboard. This marks a significant moment as variations of GPT-4 have consistently topped the chart since its inclusion. The success of Claude 3, along with Anthropic's smaller model Haiku, suggests a shift in the AI language model landscape, with top models now coming from a vendor other than OpenAI. The Chatbot Arena, operated by the Large Model Systems Organization, allows users to rate outputs from different LLMs, offering a platform to gauge AI models' effectiveness beyond traditional benchmarks. The competition among LLMs, including Google's Gemini Advanced, signifies a vibrant and evolving AI assistant space, with OpenAI expected to release a new successor to GPT-4 Turbo later this year.

엔트로픽의 클로드 3(Claude 3) 대규모언어모델(LLM)이 처음으로 챗봇 아레나(Chatbot Arena)에서 오픈AI의 GPT-4를 능가했다. 이는 지난 1년 넘게 챗봇 아레나의 정상 자리를 지켜온 GPT-4의 패배를 의미하며, 앤트로픽의 클로드 3가 더 자연스럽고 매력적인 대화를 수행할 수 있다는 것을 보여준다. 대규모모델 시스템 조직(Large Model Systems Organization)이 운영하는 챗봇 아레나는 사용자가 다양한 LLM의 출력을 평가하게 하여 전통적인 벤치마크를 넘어서 AI 모델의 효과를 가늠할 수 있는 플랫폼이다. 구글의 제머나이 어드밴스를 포함한 LLM 간의 경쟁이 치열해지며 오픈AI는 올해 후반에 GPT-4 Turbo의 새로운 후속 모델을 출시할 것으로 예상된다.

앨리스

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

삼성, 멀미 완화 앱 '히어라피' 출시...이어폰으로 60초 들으면 2시간 효과

삼성이 이어폰으로 멀미를 완화하는 무료 앱 '히어라피'를 출시했다. 100Hz 저음 사인파를 60초간 들으면 최대 2시간 멀미 증상이 억제되며, 갤럭시 버즈4 프로 외 타사 이어폰에서도 사용 가능하다.

“남들 다 포기할 때 거꾸로 간다”… 토요타, 볼보·다임러와 ‘수소 동맹’ 전격 결성

세계 최대 자동차 기업 토요타가 전기차로 쏠린 업계 흐름에 맞서 수소 연료전지 시장에 승부수를 던졌다.

이란, 애플·구글·마이크로소프트 등 미국 기업 18곳 타격 경고

이란 혁명수비대(IRGC)가 애플·구글·마이크로소프트 등 미국 기업 18곳을 중동에서 타격하겠다고 경고했다. 4월 1일 오후 8시(테헤란 기준)를 데드라인으로 제시하며 직원 대피를 촉구했다.

음식 칼로리 계산하고 3개국어 번역까지… 메타, ‘진화한 스마트 안경’ 전격 공개”

메타가 레이밴(Ray-Ban)의 모회사 에실로룩소티카와 협력해 인공지능(AI) 기능을 대폭 강화한 차세대 스마트 안경 ‘옵틱스(Optics)’ 라인업을 선보였다.