구글의 AI 검색 요약 기능 'AI 오버뷰='가 10번 중 1번꼴로 틀린 답을 내놓는다는 연구 결과가 나왔다.
뉴욕타임스는 AI 스타트업 우미(Oumi)와 함께 4,326건의 구글 검색을 분석한 결과, 제미나이 2 기반에서 정확도 85%, 제미나이 3 업그레이드 이후 91%로 올랐다고 밝혔다.
구글은 연간 5조 건 이상의 검색을 처리하는 만큼, 9%의 오답률은 매 시간 수백만 건의 잘못된 정보가 제공되는 수준이다. 정확도는 높아졌지만 답의 근거 제시 능력은 오히려 나빠졌는데, 제미나이 3에서 정확한 답의 56%는 링크된 출처로 검증이 불가능했다. 제미나이 2 때의 37%에서 크게 늘어난 수치다.
구글이 인용한 5,380개 출처 중 페이스북과 레딧이 각각 2위·4위에 올랐으며, 페이스북은 오답의 7%에서 출처로 등장했다.
뉴욕타임스 보도에 따르면 밥 말리 생가 박물관 개관 연도 오답, 요요마의 클래식 음악 명예의 전당 관련 오기 등 구체적인 오류 사례도 확인됐다.
구글 측은 이번 연구가 "심각한 허점이 있다"고 반박했으나, AI 오버뷰가 외부 트래픽을 줄이고 인터넷 생태계를 구글 중심으로 재편한다는 더 큰 논란은 계속되고 있다.
