구글, AI 압축 알고리즘 '터보퀀트' 공개…메모리 6배 줄이고 속도는 8배 향상

구글 리서치가 AI 모델의 메모리 사용량을 획기적으로 줄이는 압축 알고리즘 '터보퀀트(TurboQuant)'를 3월 24일 공개했다. 터보퀀트는 대형언어모델(LLM)과 벡터 검색 엔진을 위한 압축 알고리즘으로, 올해 열리는 AI 학술대회 ICLR 2026에서 발표될 예정이다.

핵심 원리는 두 단계로 나뉘는데, 먼저 '폴라퀀트(PolarQuant)'가 데이터를 회전시켜 고품질로 압축하고, 이어 'QJL' 알고리즘이 1비트만으로 남은 오류를 제거해 정확도를 유지한다.

실험 결과, 터보퀀트는 별도의 모델 재학습 없이 키-값(KV) 캐시를 3비트까지 압축하면서도 정확도 손실이 전혀 없었다. 엔비디아 H100 GPU에서 4비트 터보퀀트를 적용했을 때, 32비트 비압축 방식 대비 최대 8배 빠른 처리 속도를 기록했다.

메모리 사용량은 기존 대비 6배 이상 줄어들어, 롱컨텍스트 벤치마크 전 항목에서 완벽한 성능을 유지했다.

구글은 이 기술이 제미나이같은 자사 AI 모델의 병목 문제를 해결하고, 수십억 개 벡터를 다루는 시맨틱 검색의 속도와 효율도 크게 높일 것으로 기대하고 있다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

“포르쉐 타이칸 깼다”… 메르세데스-AMG, 1153마력 역대 최강 전기 괴물 공개

메르세데스-벤츠의 고성능 브랜드 AMG가 브랜드 역사상 가장 강력한 주행 성능을 자랑하는 순수 전기 고성능 세단 ‘메르세데스-AMG GT 4도어 쿠페’를 전격 공개하며 전기차 시장의 절대강자인 포르쉐 타이칸에 도전장을 던졌다.

“머스크 족쇄 풀리자마자 띄운다”… 오픈AI, 이르면 9월 나스닥 전격 상장 추진

생성형 인공지능(AI) 붐을 일으킨 오픈AI가 이르면 오는 9월 미국 뉴욕 증시 상장을 목표로 본격적인 기업공개(IPO) 절차에 착수했다.

“이제 검색 결과가 말을 건다”… 구글, ‘제미나이’ 탑재한 AI 대화형 광고 전격 도입

구글이 자사의 핵심 서비스인 검색 엔진을 인공지능(AI) 중심으로 전면 개편함에 따라, 수익 모델의 중추인 광고 시스템에도 생성형 AI를 결합한 새로운 포맷을 대거 도입한다.

구글 마케팅 라이브 2026…AI 광고 포맷 4종 공개, 검색 광고 판 바뀐다

구글이 마케팅 라이브 2026에서 제미나이 기반 대화형 광고 4종을 공개했다. AI 모드 안에서 소비자 질문에 직접 답하는 광고로, 검색 광고 패러다임이 바뀐다.