구글, AI 압축 알고리즘 '터보퀀트' 공개…메모리 6배 줄이고 속도는 8배 향상

구글 리서치가 AI 모델의 메모리 사용량을 획기적으로 줄이는 압축 알고리즘 '터보퀀트(TurboQuant)'를 3월 24일 공개했다. 터보퀀트는 대형언어모델(LLM)과 벡터 검색 엔진을 위한 압축 알고리즘으로, 올해 열리는 AI 학술대회 ICLR 2026에서 발표될 예정이다.

핵심 원리는 두 단계로 나뉘는데, 먼저 '폴라퀀트(PolarQuant)'가 데이터를 회전시켜 고품질로 압축하고, 이어 'QJL' 알고리즘이 1비트만으로 남은 오류를 제거해 정확도를 유지한다.

실험 결과, 터보퀀트는 별도의 모델 재학습 없이 키-값(KV) 캐시를 3비트까지 압축하면서도 정확도 손실이 전혀 없었다. 엔비디아 H100 GPU에서 4비트 터보퀀트를 적용했을 때, 32비트 비압축 방식 대비 최대 8배 빠른 처리 속도를 기록했다.

메모리 사용량은 기존 대비 6배 이상 줄어들어, 롱컨텍스트 벤치마크 전 항목에서 완벽한 성능을 유지했다.

구글은 이 기술이 제미나이같은 자사 AI 모델의 병목 문제를 해결하고, 수십억 개 벡터를 다루는 시맨틱 검색의 속도와 효율도 크게 높일 것으로 기대하고 있다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

엔비디아 독점 깬다…앤트로픽, 삼성과 손잡고 자체 ‘AI 칩’ 개발 착수

인공지능(AI) 스타트업 앤스로픽이 반도체 공급 부족 사태에 대응하고 독점 체제인 엔비디아 의존도를 낮추기 위해 삼성전자와 손을 잡는다.

6조 원 족쇄 채워진 구글…EU 반독점 소송 ‘최종 패소’

구글이 안드로이드 운영체제(OS)의 시장 지배력 남용 혐의로 부과받은 6조 원대 천문학적 과징금 소송에서 끝내 최종 패소했다. 이로써 10년을 끌어온 EU와 구글 간의 대하 법정 공방은 구글의 완패로 막을 내렸다.

아마존, 우주 인터넷 ‘레오’ 출격 준비 끝

아마존이 우주 인터넷 시장 진출을 위한 가시적인 발판을 마련했다. 아마존은 저궤도(LEO) 위성 광대역 서비스 ‘레오(Leo)’의 초기 가동에 필요한 충분한 위성 숫자를 확보하고 본격적인 서비스 배포 준비에 착수했다.

‘일론 머스크 리스크’도 비웃었다…테슬라, 2년 만에 역대급 ‘대반전’ 성공

상습적인 하락세를 걷던 테슬라가 올해 2분기 전 세계 시장에서 약 480,000대의 차량을 인도하며 전년 동기 대비 25% 급증한 반전 실적을 기록했다.