구글, AI 압축 알고리즘 '터보퀀트' 공개…메모리 6배 줄이고 속도는 8배 향상

구글 리서치가 AI 모델의 메모리 사용량을 획기적으로 줄이는 압축 알고리즘 '터보퀀트(TurboQuant)'를 3월 24일 공개했다. 터보퀀트는 대형언어모델(LLM)과 벡터 검색 엔진을 위한 압축 알고리즘으로, 올해 열리는 AI 학술대회 ICLR 2026에서 발표될 예정이다.

핵심 원리는 두 단계로 나뉘는데, 먼저 '폴라퀀트(PolarQuant)'가 데이터를 회전시켜 고품질로 압축하고, 이어 'QJL' 알고리즘이 1비트만으로 남은 오류를 제거해 정확도를 유지한다.

실험 결과, 터보퀀트는 별도의 모델 재학습 없이 키-값(KV) 캐시를 3비트까지 압축하면서도 정확도 손실이 전혀 없었다. 엔비디아 H100 GPU에서 4비트 터보퀀트를 적용했을 때, 32비트 비압축 방식 대비 최대 8배 빠른 처리 속도를 기록했다.

메모리 사용량은 기존 대비 6배 이상 줄어들어, 롱컨텍스트 벤치마크 전 항목에서 완벽한 성능을 유지했다.

구글은 이 기술이 제미나이같은 자사 AI 모델의 병목 문제를 해결하고, 수십억 개 벡터를 다루는 시맨틱 검색의 속도와 효율도 크게 높일 것으로 기대하고 있다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

로켓랩, 이리듐 12조원에 인수…스페이스X 대항마 탄생하나

로켓랩이 위성통신 기업 이리듐을 약 12조 3,000억원(80억 달러)에 인수한다. 저궤도 위성 66기와 255만 가입자를 확보, 스페이스X에 맞서는 우주 수직통합 기업으로 도약한다.

스트래티지, 비트코인 매수 전면 중단...13조원 평가손실에 동반 폭락

스트래티지가 1주일간 비트코인 매수를 전면 중단했다. 847,363개 보유 코인은 약 20조원의 평가손실 상태이며, MSTR은 고점 대비 82% 폭락, STRC는 사상 최저치를 기록했다.

"구글 위치 데이터 요청, 수색영장 필수"…미 연방대법원 6대 3 판결

미 연방대법원이 6대 3으로 지오펜스 영장을 수정헌법 4조상 '수색'으로 규정했다. 경찰은 이제 구글 등에 위치 데이터를 요청할 때 반드시 영장을 받아야 한다.

일론 머스크의 소송에서 이겼다...테슬라 출신 '로봇 손' 스타트업, 150억 대박 투자 유치

테슬라의 휴머노이드 로봇 '옵티머스' 개발진 출신이 설립한 로봇 기술 스타트업 프로셉션(Proception)이 친정 통과의례였던 법정 공방을 끝내고 대규모 투자 유치에 성공했다.