딥시크 V3.1 출시, R1 모델 뛰어넘으며 AI 에이전트 시대 개막

Chinese AI startup DeepSeek quietly released its massive 685-billion-parameter open-source language model DeepSeek-V3.1, creating significant waves in the AI industry despite its low-key launch. The model, increased from its 671B predecessor, features a 128,000-token context window and uses Mixture-of-Experts (MoE) architecture that activates only 37 billion parameters per token to keep inference costs low. It employs a hybrid design integrating reasoning and non-reasoning functions into a single model, operating in default chat mode but switching to thinking and tool-use modes with special tokens. Early benchmarks show the model achieving a 71.6% score on the Aider coding benchmark, slightly outperforming Anthropic's Claude Opus 4 while being significantly more cost-effective. The model delivers performance at approximately $1.01 per complete coding task compared to systems costing nearly $70 for equivalent workloads. Released under the permissive MIT license for commercial use and modification, it's freely available on Hugging Face, directly challenging the high-cost, closed business models of American AI giants. However, its enormous 700GB size presents practical barriers for self-hosting and customization, requiring substantial computational resources and expertise that most organizations lack.

중국 AI 스타트업 딥시크가 6,850억 개 매개변수를 가진 대규모 오픈소스 언어모델 딥시크-V3.1을 조용히 출시했지만 AI 업계에 큰 파장을 일으키고 있다. 이 모델은 이전 버전 6,710억 개에서 증가한 규모로 128,000 토큰 컨텍스트 윈도우를 지원하며, 전문가 혼합(MoE) 아키텍처를 통해 토큰당 370억 개 매개변수만 활성화해 추론 비용을 절약한다. 추론과 일반 기능을 단일 모델에 통합한 하이브리드 설계로 기본 채팅 모드에서 작동하다가 특수 토큰 추가로 사고 및 도구 사용 모드로 전환할 수 있다. 초기 벤치마크에서 에이더(Aider) 코딩 테스트 71.6% 점수를 기록해 앤트로픽의 클로드 오푸스 4를 약간 앞서면서도 비용은 훨씬 저렴한 것으로 나타났다. 완전한 코딩 작업당 약 1,410원($1.01) 비용으로 동등한 작업량에 9만7,860원($70)에 가까운 비용이 드는 시스템들보다 현저히 경제적이다. MIT 라이선스로 상업적 사용과 수정이 가능하며 허깅페이스에서 무료로 이용할 수 있어 미국 AI 거대기업들의 고비용 폐쇄형 비즈니스 모델에 직접적인 도전장을 내밀고 있다. 하지만 700GB에 달하는 거대한 크기로 인해 자체 호스팅과 커스터마이징에는 상당한 컴퓨팅 자원과 전문성이 필요해 대부분 조직에게는 실질적인 장벽이 될 것으로 보인다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

로켓랩, 이리듐 12조원에 인수…스페이스X 대항마 탄생하나

로켓랩이 위성통신 기업 이리듐을 약 12조 3,000억원(80억 달러)에 인수한다. 저궤도 위성 66기와 255만 가입자를 확보, 스페이스X에 맞서는 우주 수직통합 기업으로 도약한다.

스트래티지, 비트코인 매수 전면 중단...13조원 평가손실에 동반 폭락

스트래티지가 1주일간 비트코인 매수를 전면 중단했다. 847,363개 보유 코인은 약 20조원의 평가손실 상태이며, MSTR은 고점 대비 82% 폭락, STRC는 사상 최저치를 기록했다.

"구글 위치 데이터 요청, 수색영장 필수"…미 연방대법원 6대 3 판결

미 연방대법원이 6대 3으로 지오펜스 영장을 수정헌법 4조상 '수색'으로 규정했다. 경찰은 이제 구글 등에 위치 데이터를 요청할 때 반드시 영장을 받아야 한다.

일론 머스크의 소송에서 이겼다...테슬라 출신 '로봇 손' 스타트업, 150억 대박 투자 유치

테슬라의 휴머노이드 로봇 '옵티머스' 개발진 출신이 설립한 로봇 기술 스타트업 프로셉션(Proception)이 친정 통과의례였던 법정 공방을 끝내고 대규모 투자 유치에 성공했다.