딥시크, 추론 비용 절반 줄이는 ‘스파스 어텐션’ 모델 공개

Chinese AI startup DeepSeek has unveiled an experimental model, “V3.2-exp,” aimed at optimizing long-context processing. The model adopts a “Sparse Attention” mechanism that selectively processes only the most important parts of the context window and focuses on specific tokens, allowing it to reduce API call costs by up to 50 percent in initial testing. DeepSeek has released the model on Hugging Face and published a related research paper on GitHub. The researchers explained that this approach enables more efficient operation of the fundamental transformer architecture.

중국 AI 스타트업 딥시크(DeepSeek)가 장기 문맥 처리 최적화를 목표로 한 실험용 모델 ‘V3.2-exp’를 공개했다. 이번 모델은 ‘스파스 어텐션(Sparse Attention)’ 방식을 도입해 문맥 창에서 중요한 부분만 선별적으로 처리하고, 선택된 토큰만 집중 분석하는 구조다. 이를 통해 기존 대비 최대 50%까지 API 호출 비용을 줄일 수 있는 것으로 초기 테스트에서 확인됐다. 딥시크는 해당 모델을 허깅페이스(Hugging Face)에 공개했으며, 관련 논문도 깃허브에 게시했다. 연구진은 이를 통해 기본 트랜스포머 구조를 더 효율적으로 운용할 수 있다고 설명했다.

앨리스

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

로켓랩, 이리듐 12조원에 인수…스페이스X 대항마 탄생하나

로켓랩이 위성통신 기업 이리듐을 약 12조 3,000억원(80억 달러)에 인수한다. 저궤도 위성 66기와 255만 가입자를 확보, 스페이스X에 맞서는 우주 수직통합 기업으로 도약한다.

스트래티지, 비트코인 매수 전면 중단...13조원 평가손실에 동반 폭락

스트래티지가 1주일간 비트코인 매수를 전면 중단했다. 847,363개 보유 코인은 약 20조원의 평가손실 상태이며, MSTR은 고점 대비 82% 폭락, STRC는 사상 최저치를 기록했다.

"구글 위치 데이터 요청, 수색영장 필수"…미 연방대법원 6대 3 판결

미 연방대법원이 6대 3으로 지오펜스 영장을 수정헌법 4조상 '수색'으로 규정했다. 경찰은 이제 구글 등에 위치 데이터를 요청할 때 반드시 영장을 받아야 한다.

일론 머스크의 소송에서 이겼다...테슬라 출신 '로봇 손' 스타트업, 150억 대박 투자 유치

테슬라의 휴머노이드 로봇 '옵티머스' 개발진 출신이 설립한 로봇 기술 스타트업 프로셉션(Proception)이 친정 통과의례였던 법정 공방을 끝내고 대규모 투자 유치에 성공했다.