딥시크 AI 모델 훈련 비용 30만 달러…네이처 논문서 공개

The development process of the R1 artificial intelligence (AI) model, created by Chinese start-up DeepSeek, has received its first official validation through publication in Nature. According to the paper, R1 was trained for about $294,000 (roughly $300,000), a remarkably lower cost compared with existing rival models. R1 is specialized in reasoning tasks such as mathematics and coding, and it made waves by shaking the U.S. stock market immediately after its release in January. As an open-weight model available for anyone to download, it has drawn significant attention among AI researchers, with more than 10.9 million downloads to date. DeepSeek differentiated R1 by applying a pure reinforcement learning method, rewarding the model for arriving at correct answers rather than relying on human-provided examples. Researchers have praised this approach, saying it has “sparked a revolution” in how large language models (LLMs) are trained for reasoning. The publication also rebuffed suspicions that DeepSeek had used outputs from rival OpenAI models. The company clarified that while R1’s base training relied on general web data — which may include AI-generated content — it was not directly trained by copying OpenAI’s outputs.

중국 스타트업 딥시크가 개발한 인공지능(AI) 모델 R1의 개발 과정이 네이처에 게재되며 처음으로 공식 검증을 받았다. 논문에 따르면 R1은 약 29만4천 달러(한화 약 30만 달러)로 훈련됐으며, 기존 경쟁 모델 대비 압도적으로 낮은 비용으로 만들어졌다. R1은 수학·코딩 등 추론 과제에 특화된 모델로 지난 1월 공개 직후 미국 증시를 흔들 만큼 파급력을 보였다. ‘오픈 웨이트’ 방식으로 공개돼 누구나 내려받을 수 있으며, 현재까지 1,090만 회 이상 다운로드되는 등 AI 연구자들 사이에서 큰 주목을 받고 있다. 딥시크는 정답 도출 여부를 보상하는 순수 강화학습 방식을 적용해 기존 모델과 차별화를 꾀했다. 연구자들은 이번 사례가 “LLM 추론 학습 방식의 혁명을 촉발했다”고 평가했다. 한편 이번 공개로 딥시크가 경쟁사 오픈AI 모델 출력을 활용했을 것이라는 의혹도 반박됐다. R1은 기존 웹 데이터 학습을 통해 만들어졌지만, 오픈AI 결과물을 직접 복제하지는 않았다는 것이 회사 측 설명이다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

로켓랩, 이리듐 12조원에 인수…스페이스X 대항마 탄생하나

로켓랩이 위성통신 기업 이리듐을 약 12조 3,000억원(80억 달러)에 인수한다. 저궤도 위성 66기와 255만 가입자를 확보, 스페이스X에 맞서는 우주 수직통합 기업으로 도약한다.

스트래티지, 비트코인 매수 전면 중단...13조원 평가손실에 동반 폭락

스트래티지가 1주일간 비트코인 매수를 전면 중단했다. 847,363개 보유 코인은 약 20조원의 평가손실 상태이며, MSTR은 고점 대비 82% 폭락, STRC는 사상 최저치를 기록했다.

"구글 위치 데이터 요청, 수색영장 필수"…미 연방대법원 6대 3 판결

미 연방대법원이 6대 3으로 지오펜스 영장을 수정헌법 4조상 '수색'으로 규정했다. 경찰은 이제 구글 등에 위치 데이터를 요청할 때 반드시 영장을 받아야 한다.

일론 머스크의 소송에서 이겼다...테슬라 출신 '로봇 손' 스타트업, 150억 대박 투자 유치

테슬라의 휴머노이드 로봇 '옵티머스' 개발진 출신이 설립한 로봇 기술 스타트업 프로셉션(Proception)이 친정 통과의례였던 법정 공방을 끝내고 대규모 투자 유치에 성공했다.