구글 공동 창립자 세르게이 브린은 왜 '제미나이'를 엉망진창이라고 말했을까?

'제미나이'는 구글이 2023년 12월 6일 공개한 차세대 거대언어모델(LLM) 기반 인공지능(AI)이다. 제미나이는 이미지를 인식하고 음성으로 말하거나 들을 수 있으며 코딩을 할 수 있는 능력까지 갖춘 멀티모달 AI로 만들어졌다. 멀티모달은 다양한 모드 즉 시각, 청각 등을 활용해 텍스트뿐만 아니라 이미지, 음성, 영상 등으로 상호작용하는 것을 말한다.

인공지능이 만든 결과물. 여기서 사용자들은 그 결과물을 맹신하느냐 혹은 의심하느냐에 따라 결과물의 사용 계획이 명확해진다. 또한 불분명한 답변에 대한 의심은 결과물의 확인 작업이 후속 되고 있다. 인공지능은 그 동안 인간이 장시간에 걸친 '작업'을 단기간으로 줄여주는 획기적인 역할을 한다. 하지만, 이러한 의심에 가득찬 결과물은 확인 작업이라는 사용자 노동을 권유하게 만들기도 한다. 수학과 과학의 계산과 다르게 역사와 논리는 후속의 일들을 거치게 되는 것이다.

OpenAI의 '챗GPT', 마이크로소프트의 '빙'과 '코파일럿', 구글의 생성형 인공지능 '제미나이', 메타의 '메타 AI' 등 빅테크가 개발한 AI모델 역시 이러한 후속 작업이 필수가 되었다.

특히, 메타의 이미지 생성기 ‘이매진 위드 메타 AI’와 구글의 '제미나이'는 미국의 역사적 인물을 유색인종으로 바꿔 그리는 오류로 인해 이미지 생성 기능이 중단됐다.

페이스북, 인스타그램 등에 삽입된 메타의 AI 기반 이미지 생성 기능인 이매진은 여러 명의 교황을 그려달라는 요청에 흑인 교황 이미지를 생성했다. 이매진이 생성한 미국 건국자의 이미지에도 유색인종이 여럿 포함됐으며, ‘미국 식민지 시대에 살던 사람들을 그려달라’는 요청에는 아시아계 여성들의 이미지를 결과물로 내놨다. ‘나치’나 ‘노예’ 등의 단어가 포함된 요청에는 이미지를 생성하지 않았다.

구글의 AI 모델 '제미나이'도 미국 건국자나 아인슈타인 등 역사적 인물을 유색인종으로 묘사했다. 독일 나치군을 아시아 인종으로 생성하는 등의 오류가 발견돼 출시 20여일 만에 이미지 생성 기능이 중단됐는데, 순다르 피차이 구글 최고경영자(CEO)는 “오류로 인해 이용자들에게 불쾌감을 주고 편견을 드러냈다”며 “이 문제를 해결하기 위해 24시간 노력하고 있다”고 밝혔다.

그뿐인가? OpenAI의 '챗GPT'는 "독도는 누구 땅?"이라는 질문에 "분쟁지역"이라는 답변을 내놓았다. 대한민국 주권을 가지고 있는 필자의 입장에서는 "독도는 한국이 통제하고 있지만, 일본도 주장하고 있는 지역입니다. 국제적인 분쟁지역 중 하나입니다"라는 결과물은 단순히 깊은 한숨을 넘어 뭔가 끓어오르게 만드는 답변이었다. 물론, 글을 쓰고 있는 현 시점에서의 검색은 "독도는 한국 땅입니다"라는 결과물이 도출된다.

독도는 누구 땅? 챗GPT 답변. (사진=테크42)

구글 딥마인드가 만든 ‘알파 지오메트리’는 기하학 문제를 푸는 인공지능이다. 국제 수학 올림피아드 대회 문제를 풀었을 때 은상을 받을 수준이라 한다. 하지만, 서론에서 말했듯이 인공지능은 논리 추론에 취약하다. 논리 추론에 우리가 확인 작업을 필수로 진행하는 이유는 인공지능이 대부분 ‘패턴 인식’에 특화된 구조로 되어 있기 때문이다. 패턴 인식 인공지능은 방대한 학습 데이터 속에서 반복되는 형태를 포착하고, 이를 이용해 가장 그럴듯한 답을 도출한다. 예컨대 사진 속 물건을 식별해 내는 사물 인식 인공지능은 각각의 사물이 어떤 모습을 갖추고 있는지 패턴을 배운다.

챗봇 인공지능도 비슷하다. 인간의 대화 패턴을 찾아 각각의 맥락에 어울리는 단 하나의 답변을 생성한다. 인간의 대화 뿐만 아니라 과정의 공식이 있는 수학이나 과학처럼 숨은 패턴이 반복되는 영역에서 인공지능은 그 빛을 발한다.

양면성이 존재하는 인공지능... 지금의 문제는 무엇일까?

구글의 공동 설립자 세르게이 브린은 'AGI 하우스'에서 개최한 공개 행사에서 인공지능 열광자들에게 "인공지능의 발전 궤적이 너무나 흥미로워 은퇴에서 나왔다"고 말한 바 있다.

AGI 하우스는 개발자와 설립자들이 구글의 제미니 모델을 테스트하고 있는 곳이다. AGI는 인공 일반 지능(Artificial General Intelligence)을 의미하며 인간과 동등한 수준 또는 그 이상의 작업을 완료할 수 있는 인공지능을 말한다.

브린은 참석자들에게 명확하고 명료하게 말했다. "개인적인 생각이지만, 우리는 이미지 생성 부분에서 분명히 엉망진창이었다". '개인적'이라는 단서를 붙였지만, 브린의 발언은 제미나이가 오류로 생성한 이미지들의 결과물에 대한 회사 차원의 공식적인 답변이었다. 브린은 1998년 래리 페이지와 함께 구글을 공동 설립했지만 2019년 알파벳 회장직에서 물러났다. 현재 이사회 멤버이자 주요 주주로서 약 133조 2,900억 원에 달하는 회사 지분을 보유하고 있지만, 초경쟁적인 인공지능 시장에서 구글의 입지를 강화하는 데 도움을 주고자 다시 일하기 시작했다.

구글 공동창업자인 세르게이 브린. (사진=CNBC)

그렇다면, 브린이 말하는 오류의 원인은 무엇이었을까? "주로 철저한 테스트를 하지 않았기 때문이라고 생각한다. 분명히 정당한 이유로 많은 사람들을 화나게 했다" 결국 인공지능의 결과물은 인간의 노력이 필수라는 불가항력의 답변을 내놓았다.

브린은 서두에 철저한 테스트를 거치지 않았다면서 두 가지 이유를 가정했다. 첫 번째는 제미나이가 다양한 사람들을 보여주도록 하는 튜닝은 분명히 보여주면 안 되는 경우를 고려하지 못했다는 것이다. 두 번재는 시간이 지남에 따라 인공지능 모델은 우리가 의도했던 것보다 훨씬 더 조심스러워졌으며 일부 매우 순진한 질문을 민감하다고 잘못 해석하여 특정 질문에 전혀 답변하지 않았다고 말했다.

이 두 가지 요소는 모델이 어떤 경우에는 과도하게 보상하고 다른 경우에는 지나치게 수수하게 결과물을 만들었다는 얘기로 결국 모델의 추론을 설정하는 인간의 의지인 것으로 풀이된다.

결과물은 인공지능이 만들지만 결과물을 만들어 내는 과정은 인간의 개입이 들어간다는 결론이다. 그 과정을 만드는 인간의 성향에 따라 결과물이 전혀 다르게 해석될 수 있다는 말이다. 이에 브린은 "구글만 AI 정확한 결과 생성에 어려움을 겪고 있는 것이 아니다"고 말했다. 그는 OpenAI의 ChatGPT와 일론 머스크의 그록(Grok) 서비스를 예시로 들며 "꽤 이상한 결과물을 만들며 분명히 인간의 성향이 개입됐다"고 말했다.

OpenAI의 창립자 샘 알트만은 "AI가 사회를 재구성할 것이며 그 위험을 인정한다. 이것이 조금 두렵기도 하다"고 말한 바 있다. 또한 "내가 희망하는 것은 우리 모두가 AI를 우리의 일상생활과 경제에 통합하고 인간 의지를 증폭시키는 다양한 방식으로 사용할 수 있는 점점 더 강력한 시스템을 지속적으로 개발하는 것이다"라고 말했다. 인공지능을 통해 인간의 의지를 증폭시키는. 인간을 위한 인공지능.

분명히 인공지능은 인간보다 똑똑하다. 다만, 그 똑똑해지는 임계값을 넘는 구현은 인간을 통해서 이뤄진다.

인공지능은 인간의 학습능력, 추론능력, 지각능력을 인공적으로 구현시키는 컴퓨터과학의 한 분야이다. 자연어의 이해, 음성 번역, 로보틱스, 인공 시각, 문제 해결, 학습과 지식 획득, 인지 과학 등에 응용된다. 인간을 포함한 동물이 갖고 있는 자연지능(natural intelligence)과는 다른 개념이다. 전혀 다른 개념의 컴퓨터과학의 한 분야에 자연지능을 가지고 있는 인간의 개입이 주도적인 결과물을 만들어 내는 것. 현재 인공지능의 최대 한계점일 것이다.

김광우 기자

kimnoba@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

야렉 쿠틸로브스키 딥엘 창업자 “사람과 상호작용하는 자체 LLM 기반 언어 AI 개발…번역, 글쓰기 이어 음성 번역 서비스도 선보일 것”

26일 딥엘의 창업자인 야렉 쿠틸로브스키 CEO가 직접 한국을 방문해 시장 진출 1년의 성과와 향후 전략을 발표했다. 쿠틸로브스키 CEO가 소개한 딥엘 라이트 프로는 딥엘의 자체 거대언어모델(LLM)로 구동되는 첫 서비스로, 기업이 사내외 커뮤니케이션, 계약서 등 기업이 글로벌 비즈니스 상황에서 더 명확하게 소통하는데 기여할 것으로 기대하고 있다.

자, 그럼 이제 ‘틱톡’은 누가 사게 되나요?

미국 의회가 틱톡을 미국에서 금지하는 법안을 통과시키고 하루만에 조 바이든 미국 대통령이 이에 서명함에따라, 설마했던 미국 틱톡 금지가 현실화 되고 있다. 이제 미국 정부와 업계는 틱톡의 새로운 주인을 찾기 위한 전략을 빠르게 세우고 있다.

[인터뷰] 김민석 로켓툴즈 대표 “데이터 수집과 분석, CRM까지 자동으로 하는 ‘AI 마케터’를 만들고 있습니다”

로켓툴즈는 퍼스트파티데이터를 분석하고 고품질 데이터로 추출해 정합성을 높이는 단계는 물론 CRM 마케팅에 필요한 타깃 정의, 콘텐츠 제작, 세팅, 결과 분석까지 제공하는 솔루션을 개발하고 있다. 여기에 더해 고객이 회원 가입시 쿠폰을 발급하고 자사몰에 접속했을 때 뜨는 팝업, 구매 유도를 위한 카카오톡 알림톡까지 자동으로 연계될 수 있도록 한다는 것이다. 이름하여 ‘AI 마케터’다.

달에서 문자하고 화성에서 스트리밍할까요?

달 탐험을 강화하고 궁극적으로 위성 행성에 인간이 존재할수 있는 미래를 모색하기 위해 NASA와 노키아가 올해 말, 달에서 4G 모바일 네트워크를 출시할 준비를 진행중이다. 이는 우주 식민지 주민이 개인 디바이스를 네트워크에 연결해 지구인이 사용하는 모든 앱과 서비스에 액세스할수 있는 스마트폰을 사용할 수 있다는 것을 의미한다.