구글 공동 창립자 세르게이 브린은 왜 '제미나이'를 엉망진창이라고 말했을까?

'제미나이'는 구글이 2023년 12월 6일 공개한 차세대 거대언어모델(LLM) 기반 인공지능(AI)이다. 제미나이는 이미지를 인식하고 음성으로 말하거나 들을 수 있으며 코딩을 할 수 있는 능력까지 갖춘 멀티모달 AI로 만들어졌다. 멀티모달은 다양한 모드 즉 시각, 청각 등을 활용해 텍스트뿐만 아니라 이미지, 음성, 영상 등으로 상호작용하는 것을 말한다.

인공지능이 만든 결과물. 여기서 사용자들은 그 결과물을 맹신하느냐 혹은 의심하느냐에 따라 결과물의 사용 계획이 명확해진다. 또한 불분명한 답변에 대한 의심은 결과물의 확인 작업이 후속 되고 있다. 인공지능은 그 동안 인간이 장시간에 걸친 '작업'을 단기간으로 줄여주는 획기적인 역할을 한다. 하지만, 이러한 의심에 가득찬 결과물은 확인 작업이라는 사용자 노동을 권유하게 만들기도 한다. 수학과 과학의 계산과 다르게 역사와 논리는 후속의 일들을 거치게 되는 것이다.

OpenAI의 '챗GPT', 마이크로소프트의 '빙'과 '코파일럿', 구글의 생성형 인공지능 '제미나이', 메타의 '메타 AI' 등 빅테크가 개발한 AI모델 역시 이러한 후속 작업이 필수가 되었다.

특히, 메타의 이미지 생성기 ‘이매진 위드 메타 AI’와 구글의 '제미나이'는 미국의 역사적 인물을 유색인종으로 바꿔 그리는 오류로 인해 이미지 생성 기능이 중단됐다.

페이스북, 인스타그램 등에 삽입된 메타의 AI 기반 이미지 생성 기능인 이매진은 여러 명의 교황을 그려달라는 요청에 흑인 교황 이미지를 생성했다. 이매진이 생성한 미국 건국자의 이미지에도 유색인종이 여럿 포함됐으며, ‘미국 식민지 시대에 살던 사람들을 그려달라’는 요청에는 아시아계 여성들의 이미지를 결과물로 내놨다. ‘나치’나 ‘노예’ 등의 단어가 포함된 요청에는 이미지를 생성하지 않았다.

구글의 AI 모델 '제미나이'도 미국 건국자나 아인슈타인 등 역사적 인물을 유색인종으로 묘사했다. 독일 나치군을 아시아 인종으로 생성하는 등의 오류가 발견돼 출시 20여일 만에 이미지 생성 기능이 중단됐는데, 순다르 피차이 구글 최고경영자(CEO)는 “오류로 인해 이용자들에게 불쾌감을 주고 편견을 드러냈다”며 “이 문제를 해결하기 위해 24시간 노력하고 있다”고 밝혔다.

그뿐인가? OpenAI의 '챗GPT'는 "독도는 누구 땅?"이라는 질문에 "분쟁지역"이라는 답변을 내놓았다. 대한민국 주권을 가지고 있는 필자의 입장에서는 "독도는 한국이 통제하고 있지만, 일본도 주장하고 있는 지역입니다. 국제적인 분쟁지역 중 하나입니다"라는 결과물은 단순히 깊은 한숨을 넘어 뭔가 끓어오르게 만드는 답변이었다. 물론, 글을 쓰고 있는 현 시점에서의 검색은 "독도는 한국 땅입니다"라는 결과물이 도출된다.

독도는 누구 땅? 챗GPT 답변. (사진=테크42)

구글 딥마인드가 만든 ‘알파 지오메트리’는 기하학 문제를 푸는 인공지능이다. 국제 수학 올림피아드 대회 문제를 풀었을 때 은상을 받을 수준이라 한다. 하지만, 서론에서 말했듯이 인공지능은 논리 추론에 취약하다. 논리 추론에 우리가 확인 작업을 필수로 진행하는 이유는 인공지능이 대부분 ‘패턴 인식’에 특화된 구조로 되어 있기 때문이다. 패턴 인식 인공지능은 방대한 학습 데이터 속에서 반복되는 형태를 포착하고, 이를 이용해 가장 그럴듯한 답을 도출한다. 예컨대 사진 속 물건을 식별해 내는 사물 인식 인공지능은 각각의 사물이 어떤 모습을 갖추고 있는지 패턴을 배운다.

챗봇 인공지능도 비슷하다. 인간의 대화 패턴을 찾아 각각의 맥락에 어울리는 단 하나의 답변을 생성한다. 인간의 대화 뿐만 아니라 과정의 공식이 있는 수학이나 과학처럼 숨은 패턴이 반복되는 영역에서 인공지능은 그 빛을 발한다.

양면성이 존재하는 인공지능... 지금의 문제는 무엇일까?

구글의 공동 설립자 세르게이 브린은 'AGI 하우스'에서 개최한 공개 행사에서 인공지능 열광자들에게 "인공지능의 발전 궤적이 너무나 흥미로워 은퇴에서 나왔다"고 말한 바 있다.

AGI 하우스는 개발자와 설립자들이 구글의 제미니 모델을 테스트하고 있는 곳이다. AGI는 인공 일반 지능(Artificial General Intelligence)을 의미하며 인간과 동등한 수준 또는 그 이상의 작업을 완료할 수 있는 인공지능을 말한다.

브린은 참석자들에게 명확하고 명료하게 말했다. "개인적인 생각이지만, 우리는 이미지 생성 부분에서 분명히 엉망진창이었다". '개인적'이라는 단서를 붙였지만, 브린의 발언은 제미나이가 오류로 생성한 이미지들의 결과물에 대한 회사 차원의 공식적인 답변이었다. 브린은 1998년 래리 페이지와 함께 구글을 공동 설립했지만 2019년 알파벳 회장직에서 물러났다. 현재 이사회 멤버이자 주요 주주로서 약 133조 2,900억 원에 달하는 회사 지분을 보유하고 있지만, 초경쟁적인 인공지능 시장에서 구글의 입지를 강화하는 데 도움을 주고자 다시 일하기 시작했다.

구글 공동창업자인 세르게이 브린. (사진=CNBC)

그렇다면, 브린이 말하는 오류의 원인은 무엇이었을까? "주로 철저한 테스트를 하지 않았기 때문이라고 생각한다. 분명히 정당한 이유로 많은 사람들을 화나게 했다" 결국 인공지능의 결과물은 인간의 노력이 필수라는 불가항력의 답변을 내놓았다.

브린은 서두에 철저한 테스트를 거치지 않았다면서 두 가지 이유를 가정했다. 첫 번째는 제미나이가 다양한 사람들을 보여주도록 하는 튜닝은 분명히 보여주면 안 되는 경우를 고려하지 못했다는 것이다. 두 번재는 시간이 지남에 따라 인공지능 모델은 우리가 의도했던 것보다 훨씬 더 조심스러워졌으며 일부 매우 순진한 질문을 민감하다고 잘못 해석하여 특정 질문에 전혀 답변하지 않았다고 말했다.

이 두 가지 요소는 모델이 어떤 경우에는 과도하게 보상하고 다른 경우에는 지나치게 수수하게 결과물을 만들었다는 얘기로 결국 모델의 추론을 설정하는 인간의 의지인 것으로 풀이된다.

결과물은 인공지능이 만들지만 결과물을 만들어 내는 과정은 인간의 개입이 들어간다는 결론이다. 그 과정을 만드는 인간의 성향에 따라 결과물이 전혀 다르게 해석될 수 있다는 말이다. 이에 브린은 "구글만 AI 정확한 결과 생성에 어려움을 겪고 있는 것이 아니다"고 말했다. 그는 OpenAI의 ChatGPT와 일론 머스크의 그록(Grok) 서비스를 예시로 들며 "꽤 이상한 결과물을 만들며 분명히 인간의 성향이 개입됐다"고 말했다.

OpenAI의 창립자 샘 알트만은 "AI가 사회를 재구성할 것이며 그 위험을 인정한다. 이것이 조금 두렵기도 하다"고 말한 바 있다. 또한 "내가 희망하는 것은 우리 모두가 AI를 우리의 일상생활과 경제에 통합하고 인간 의지를 증폭시키는 다양한 방식으로 사용할 수 있는 점점 더 강력한 시스템을 지속적으로 개발하는 것이다"라고 말했다. 인공지능을 통해 인간의 의지를 증폭시키는. 인간을 위한 인공지능.

분명히 인공지능은 인간보다 똑똑하다. 다만, 그 똑똑해지는 임계값을 넘는 구현은 인간을 통해서 이뤄진다.

인공지능은 인간의 학습능력, 추론능력, 지각능력을 인공적으로 구현시키는 컴퓨터과학의 한 분야이다. 자연어의 이해, 음성 번역, 로보틱스, 인공 시각, 문제 해결, 학습과 지식 획득, 인지 과학 등에 응용된다. 인간을 포함한 동물이 갖고 있는 자연지능(natural intelligence)과는 다른 개념이다. 전혀 다른 개념의 컴퓨터과학의 한 분야에 자연지능을 가지고 있는 인간의 개입이 주도적인 결과물을 만들어 내는 것. 현재 인공지능의 최대 한계점일 것이다.

김광우 기자

kimnoba@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

모르면 손해! 3억 구독자 등에 업은 ‘넷플릭스 무료게임’ 최신 리스트

넷플릭스가 넷플릭스게임즈를 키우기 위해 에픽게임즈의 인재를 영입하면서 곧 기업에 상당한 움직임이 있을 것으로 예상되고 있다. 올해 초 넷플릭스게임즈는 2024년 로드맵을 발표했으며, 여기에는 스트리밍 플랫폼을 통해 액세스할 수 있는 최대 14개의 새로운 게임이 포함돼 있다.

도대체 왜?···머스크의 트럼프 지지 속내 3가지

일론 머스크는 트럼프가 미 대통령에 당선되더라도 바이든 행정부에서 겪은 푸대접 대신 오히려 최소 3가지 이익을 기대하며 그를 지지했을 것으로 보인다. (물론 기본적으로 머스크는 트럼프와 ‘배짱이 맞아서’ 지지했을 것이다.) 그 3가지는 ▲바이든 행정부의 전기차 보조금 공제법 폐지시에도 자사의 보급경 전기차(모델 3)는 경쟁력있다는 점 ▲바이든 행정부가 머스크와 테슬라에 보인 푸대접을 더 이상 받지 않을 것이라는 점 ▲바이든 행정부가 테슬라 자율주행 기술을 예의주시하며 잠재적으로 증권과 전신 사기 혐의로 이어질 수 있는 조사 개시를 회피할 수 있으리란 기대감이다.

[AGI 콘퍼런스 2024] 김동신 센드버드 대표 “AI 챗봇 서비스 도입의 목적은 개인화된 고객 커뮤니케이션 자동화, 사용자 경험 극대화입니다”

김동신 센드버드 대표는 “바퀴를 재발명하지 않는 것이 중요하다”고 강조했다. AI 서비스 개발 시 이런저런 시도로 시행착오를 거치는 과정이 불가피하지만 결국 ‘사업적 성과’로 이어지도록 빨리 시장에 선보이고 개선하는 작업을 진행해야 한다는 것이다.

‘웨이모 Vs 크루즈 Vs 사이버캡’ 미국의 ‘로보택시’ 삼파전

제너럴모터스의 자율주행차 사업부인 크루즈가 도시에서 운행하도록 설계된 자율주행 셔틀 오리진의 생산을 무기한 연기 발표하자 알파벳은 자사의 자율주행차 사업부인 웨이모에 대대적인 투자를 발표했다. 테슬라 역시 전용 로봇택시인 사이버캡 공개 계획을 미루면서, 웨이모의 미국 로보택시 시장 선점에 청신호가 켜졌다.