xAI 그록 4, 오픈AI 성능 크게 뛰어넘는 추론 능력 선보여

Elon Musk's xAI Holdings Corp. has launched a new large language model called "Grok 4," optimized for reasoning tasks on July 10th. The model specializes in code generation, math problem solving, and chart analysis, capable of processing up to 256,000 tokens of text and images. Grok 4 was trained on Colossus, a supercomputer located in Memphis that currently houses over 200,000 graphics cards. In AI benchmarking dataset "Humanity's Last Exam," Grok 4 solved more than 44% of problems, significantly outperforming OpenAI's Deep Research tool which achieved 26.6%. xAI also plans to offer "Grok 4 Heavy," an enhanced version using multiple AI agents, available through a $300 monthly subscription. Musk announced plans to release a programming-optimized version next month, an expanded multimodal version in September, and a video generation-capable version shortly after. The company aims to eventually connect the LLM to scientific applications used by Tesla for vehicle design and make it available on major public cloud platforms.

일론 머스크의 xAI홀딩스가 추론 작업에 최적화된 새로운 대형언어모델 '그록 4(Grok 4)'를 출시했다고 7월 10일 발표했다. 이 모델은 코드 생성, 수학 문제 해결, 차트 분석 등의 작업에 특화되었으며 최대 25만 6천 토큰의 텍스트와 이미지를 처리할 수 있다. 그록 4는 멤피스에 위치한 슈퍼컴퓨터 '콜로서스(Colossus)'에서 훈련되었으며, 이 시스템은 현재 20만 개 이상의 그래픽카드를 보유하고 있다. AI 벤치마킹 데이터셋 '인류의 마지막 시험(Humanity's Last Exam)'에서 그록 4는 44% 이상의 문제를 해결했으며, 이는 오픈AI의 딥리서치 도구가 기록한 26.6%를 크게 상회하는 성과다. xAI는 여러 AI 에이전트를 활용하여 더 향상된 성능을 제공하는 '그록 4 헤비(Grok 4 Heavy)' 버전도 월 411,000원($300) 구독료로 제공할 예정이다. 머스크는 다음 달 프로그래밍 작업에 최적화된 버전을, 9월에는 멀티모달 기능이 확장된 버전을, 그 후 몇 주 뒤에는 비디오 생성 기능이 탑재된 버전을 출시할 계획이라고 밝혔다.

정재엽 기자

anihil@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

“몸값 3조 육박, K-엔비디아 떴다”… 리벨리온, 4억 달러 유치하며 미국 정조준

국내 AI 반도체 스타트업 리벨리온이 4억 달러(약 6,000억 원) 규모의 대규모 투자 유치에 성공하며 글로벌 시장 진출을 위한 ‘실탄’을 확보했다.

블루스카이 AI 도입에 유저 12만 명 ‘집단 차단’

탈(脫)중앙화 소셜미디어 블루스카이가 선보인 인공지능(AI) 비서 ‘아티(Attie)’가 출시와 동시에 사용자들의 거센 역풍을 맞고 있다.

"미국인 80% AI 우려, Z세대 가장 비관적"...미국 설문조사 결과

퀴니피액 대학 여론조사에서 미국인의 AI 활용률은 높아졌지만 신뢰도는 21%에 그쳤고, 70%는 AI가 일자리를 줄일 것으로 우려했다. Z세대의 비관론이 가장 강했다.

코파일럿 코워크, MS 프런티어 프로그램 통해 첫 공개…앤트 로픽 기술 탑재

마이크로소프트가 앤스로픽과 협력해 개발한 AI 업무 자동화 기능 '코파일럿 코워크'를 프런티어 조기 체험 프로그램으로 공개했다. 사용자가 목표를 설명하면 AI가 계획을 세우고 마이크로소프트 365 전반에서 작업을 직접 수행한다.