딥시크, 추론 비용 절반 줄이는 ‘스파스 어텐션’ 모델 공개

Chinese AI startup DeepSeek has unveiled an experimental model, “V3.2-exp,” aimed at optimizing long-context processing. The model adopts a “Sparse Attention” mechanism that selectively processes only the most important parts of the context window and focuses on specific tokens, allowing it to reduce API call costs by up to 50 percent in initial testing. DeepSeek has released the model on Hugging Face and published a related research paper on GitHub. The researchers explained that this approach enables more efficient operation of the fundamental transformer architecture.

중국 AI 스타트업 딥시크(DeepSeek)가 장기 문맥 처리 최적화를 목표로 한 실험용 모델 ‘V3.2-exp’를 공개했다. 이번 모델은 ‘스파스 어텐션(Sparse Attention)’ 방식을 도입해 문맥 창에서 중요한 부분만 선별적으로 처리하고, 선택된 토큰만 집중 분석하는 구조다. 이를 통해 기존 대비 최대 50%까지 API 호출 비용을 줄일 수 있는 것으로 초기 테스트에서 확인됐다. 딥시크는 해당 모델을 허깅페이스(Hugging Face)에 공개했으며, 관련 논문도 깃허브에 게시했다. 연구진은 이를 통해 기본 트랜스포머 구조를 더 효율적으로 운용할 수 있다고 설명했다.

앨리스

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

“몸값 3조 육박, K-엔비디아 떴다”… 리벨리온, 4억 달러 유치하며 미국 정조준

국내 AI 반도체 스타트업 리벨리온이 4억 달러(약 6,000억 원) 규모의 대규모 투자 유치에 성공하며 글로벌 시장 진출을 위한 ‘실탄’을 확보했다.

블루스카이 AI 도입에 유저 12만 명 ‘집단 차단’

탈(脫)중앙화 소셜미디어 블루스카이가 선보인 인공지능(AI) 비서 ‘아티(Attie)’가 출시와 동시에 사용자들의 거센 역풍을 맞고 있다.

"미국인 80% AI 우려, Z세대 가장 비관적"...미국 설문조사 결과

퀴니피액 대학 여론조사에서 미국인의 AI 활용률은 높아졌지만 신뢰도는 21%에 그쳤고, 70%는 AI가 일자리를 줄일 것으로 우려했다. Z세대의 비관론이 가장 강했다.

코파일럿 코워크, MS 프런티어 프로그램 통해 첫 공개…앤트 로픽 기술 탑재

마이크로소프트가 앤스로픽과 협력해 개발한 AI 업무 자동화 기능 '코파일럿 코워크'를 프런티어 조기 체험 프로그램으로 공개했다. 사용자가 목표를 설명하면 AI가 계획을 세우고 마이크로소프트 365 전반에서 작업을 직접 수행한다.