딥시크 V3.1 출시, R1 모델 뛰어넘으며 AI 에이전트 시대 개막

Chinese AI startup DeepSeek quietly released its massive 685-billion-parameter open-source language model DeepSeek-V3.1, creating significant waves in the AI industry despite its low-key launch. The model, increased from its 671B predecessor, features a 128,000-token context window and uses Mixture-of-Experts (MoE) architecture that activates only 37 billion parameters per token to keep inference costs low. It employs a hybrid design integrating reasoning and non-reasoning functions into a single model, operating in default chat mode but switching to thinking and tool-use modes with special tokens. Early benchmarks show the model achieving a 71.6% score on the Aider coding benchmark, slightly outperforming Anthropic's Claude Opus 4 while being significantly more cost-effective. The model delivers performance at approximately $1.01 per complete coding task compared to systems costing nearly $70 for equivalent workloads. Released under the permissive MIT license for commercial use and modification, it's freely available on Hugging Face, directly challenging the high-cost, closed business models of American AI giants. However, its enormous 700GB size presents practical barriers for self-hosting and customization, requiring substantial computational resources and expertise that most organizations lack.

중국 AI 스타트업 딥시크가 6,850억 개 매개변수를 가진 대규모 오픈소스 언어모델 딥시크-V3.1을 조용히 출시했지만 AI 업계에 큰 파장을 일으키고 있다. 이 모델은 이전 버전 6,710억 개에서 증가한 규모로 128,000 토큰 컨텍스트 윈도우를 지원하며, 전문가 혼합(MoE) 아키텍처를 통해 토큰당 370억 개 매개변수만 활성화해 추론 비용을 절약한다. 추론과 일반 기능을 단일 모델에 통합한 하이브리드 설계로 기본 채팅 모드에서 작동하다가 특수 토큰 추가로 사고 및 도구 사용 모드로 전환할 수 있다. 초기 벤치마크에서 에이더(Aider) 코딩 테스트 71.6% 점수를 기록해 앤트로픽의 클로드 오푸스 4를 약간 앞서면서도 비용은 훨씬 저렴한 것으로 나타났다. 완전한 코딩 작업당 약 1,410원($1.01) 비용으로 동등한 작업량에 9만7,860원($70)에 가까운 비용이 드는 시스템들보다 현저히 경제적이다. MIT 라이선스로 상업적 사용과 수정이 가능하며 허깅페이스에서 무료로 이용할 수 있어 미국 AI 거대기업들의 고비용 폐쇄형 비즈니스 모델에 직접적인 도전장을 내밀고 있다. 하지만 700GB에 달하는 거대한 크기로 인해 자체 호스팅과 커스터마이징에는 상당한 컴퓨팅 자원과 전문성이 필요해 대부분 조직에게는 실질적인 장벽이 될 것으로 보인다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

“몸값 3조 육박, K-엔비디아 떴다”… 리벨리온, 4억 달러 유치하며 미국 정조준

국내 AI 반도체 스타트업 리벨리온이 4억 달러(약 6,000억 원) 규모의 대규모 투자 유치에 성공하며 글로벌 시장 진출을 위한 ‘실탄’을 확보했다.

블루스카이 AI 도입에 유저 12만 명 ‘집단 차단’

탈(脫)중앙화 소셜미디어 블루스카이가 선보인 인공지능(AI) 비서 ‘아티(Attie)’가 출시와 동시에 사용자들의 거센 역풍을 맞고 있다.

"미국인 80% AI 우려, Z세대 가장 비관적"...미국 설문조사 결과

퀴니피액 대학 여론조사에서 미국인의 AI 활용률은 높아졌지만 신뢰도는 21%에 그쳤고, 70%는 AI가 일자리를 줄일 것으로 우려했다. Z세대의 비관론이 가장 강했다.

코파일럿 코워크, MS 프런티어 프로그램 통해 첫 공개…앤트 로픽 기술 탑재

마이크로소프트가 앤스로픽과 협력해 개발한 AI 업무 자동화 기능 '코파일럿 코워크'를 프런티어 조기 체험 프로그램으로 공개했다. 사용자가 목표를 설명하면 AI가 계획을 세우고 마이크로소프트 365 전반에서 작업을 직접 수행한다.