구글이 22일(현지시간) '구글 클라우드 넥스트 2026' 행사에서 8세대 텐서처리장치(TPU)두 종을 공개했다.
이번에 선보인 칩은 AI 모델을 만드는 '학습' 전용 TPU 8t와, 만들어진 모델을 실제 서비스에 활용하는 '추론' 전용 TPU 8i로 나뉜다.
TPU 8t는 최대 9,600개 칩을 하나의 슈퍼팟(superpod)에 연결할 수 있으며, 이전 세대 대비 처리 성능이 3배, 전력 대비 성능이 2배 향상됐다. TPU 8i는 288GB 고대역폭 메모리(HBM)와 이전 세대보다 3배 많은 384MB 온칩 SRAM을 탑재해, 대형 AI 모델이 데이터를 칩 안에서 바로 처리할 수 있게 했다.
TPU 8i는 이전 세대 아이언우드(Ironwood) 대비 비용 대비 성능이 80% 향상돼, 같은 비용으로 거의 두 배 많은 사용자 요청을 처리할 수 있다고 구글은 밝혔다.
구글은 이날 행사에서 기업의 AI 도입을 지원하는 7억 5천만 달러(약 1조 1,100억 원) 규모의 펀드 조성 계획도 함께 발표했다. 두 칩은 올해 안으로 일반 제공 예정이며, 엔비디아 의존도를 줄이려는 구글의 자체 AI 반도체 전략이 본격화되고 있다는 평가가 나온다.
