구글이 9일(현지시간) 70개 이상의 언어를 실시간으로 음성 번역하는 새 AI 모델 '제미나이 3.5 라이브 트랜슬레이트'를 공개했다.
기존 번역 시스템은 상대방이 말을 끝낼 때까지 기다렸다가 번역을 내보내는 방식이었지만, 이 모델은 말이 진행되는 동시에 번역을 생성해 어색한 끊김 없이 대화가 이어지도록 한다. 화자의 억양·속도·음높이까지 살려 번역하는 것이 특징이며, 70개 이상의 언어를 수동 설정 없이 자동으로 감지한다. 배포 범위는 폭넓다.
개발자들은 '제미나이 라이브 API'와 구글 AI 스튜디오를 통해 공개 프리뷰로 즉시 이용할 수 있고, 기업용 구글 밋(Meet)에는 이달 중 비공개 프리뷰로 순차적으로 도입된다. 구글 밋에서는 기존 5개에 불과하던 지원 언어가 70개 이상으로 늘어나고, 회의 내 언어 조합이 최대 2,000가지 이상으로 확대된다.
동남아 차량 호출 플랫폼 그랩은 이미 이 모델을 시범 적용해 월 1,000만 건 이상의 통화에서 운전자와 승객의 다국어 소통을 지원하고 있다. AI가 생성한 모든 음성에는 위변조를 막기 위한 구글의 'SynthID' 워터마크가 자동으로 삽입된다.
