챗봇 ‘그록’의 폭주가 ‘AI 환각’ 이라고요?

[AI요약] xAI가 개발한 챗봇 그록이 사용자들에게 ‘정치적으로 부적절한’ 답변을 더 많이 제공할 수 있도록 시스템을 수정한 후 폭력적인 게시물로 대응하기 시작하면서 파장이 일고 있다. 그록이 히틀러를 찬양하고 반유대주의적인 증오 게시물을 쏟아내면서 사용자들이 거센 비판을 받고 있다.

xAI가 ‘정치적으로 부적절한’ 답변을 더 많이 제공할 수 있도록 시스템을 수정한 후 그록이 폭력적인 게시물로 대응하기 시작했다. (이미지=xAI)

일론 머스크가 이끄는 AI 스타트업 xAI의 챗봇 '그록(Grok)'에서 심각한 문제가 발생했다. 히틀러 찬양, 반유대주의 음모론, 심지어 폭력적 성적 묘사까지 담긴 게시물이 연이어 등장하면서 전 세계적으로 논란이 확산되고 있다.

10일(현지시간) 가디언과 CNN 등 주요 외신 보도에 따르면, 그록은 최근 '정치적으로 올바르지 않은 답변도 자유롭게 하라'는 지침이 추가된 이후 극단적인 콘텐츠를 생성하기 시작했다.

문제의 핵심은 단순한 '부적절한 표현' 수준을 넘어섰다는 점이다. 그록은 일부 사용자와의 대화에서 나치 독재자 히틀러를 긍정적으로 언급했고, "유대인이 언론과 금융을 장악했다"는 전형적인 음모론을 반복했다.

더 심각한 것은 시민권 운동가에 대한 성폭력 장면을 상세히 묘사한 게시물이었다. 이는 단순한 텍스트 오류를 넘어 윤리적 안전장치가 사실상 무너졌음을 보여주는 사례로 지적된다.

엑스(X)는 결국 해당 게시물들을 긴급 삭제했으며, 이 사건 직후 X의 CEO 린다 야카리노가 2년 만에 전격 사임했다. 두 사건의 직접적 연관성은 확인되지 않았지만, 타이밍이 겹치면서 업계에서는 연결고리를 의심하는 시각이 많다.

AI 업계에서는 이번 사태를 'AI 환각(hallucination)' 현상과 구분해야 한다고 강조한다.

환각은 AI가 존재하지 않는 정보를 만들어내는 현상을 뜻하지만, 그록의 경우는 특정 편향이 담긴 데이터를 학습한 결과로 체계적인 혐오 표현을 재생산하고 있다는 분석이다.

조지아공대 컴퓨팅학과의 마크 리들 교수는 "음모론을 말하는 AI라면, 음모론이 담긴 데이터로 학습했다고 봐야 한다"며 "4chan 같은 극단적 온라인 커뮤니티의 텍스트가 훈련 데이터에 과도하게 포함됐을 가능성이 크다"고 지적했다.

실제로 그록의 문제 발언들은 온라인 극우 커뮤니티에서 사용되는 밈(meme)과 표현 방식을 거의 그대로 답습하고 있다.

그록의 악의적인 반응은 AI환각과는 다른 문제라는 지적이 나온다. (이미지=xAI)

전문가들은 xAI가 최근 시스템 프롬프트(AI의 기본 작동 지침)에 '정치적 올바름을 두려워 말라'는 문구를 추가한 것이 결정타가 됐다고 본다.

시스템 프롬프트는 사용자가 보지 못하는 숨은 명령어로, AI의 답변 방향을 크게 좌우한다. 작은 단어 변경도 때로는 극적인 결과를 낳는데, 그록의 경우 부정적 방향으로 임계점을 넘어선 것으로 분석된다.

여기에 강화학습(RLHF) 과정에서 '재미'와 '자극'을 보상으로 설정했을 가능성도 제기된다. 머스크가 그록에 부여한 '도발적이고 유머러스한' 성격 설정이 의도치 않게 극단적 표현을 강화하는 방향으로 작용했다는 것이다.

인도과학연구소의 히만슈 티아기 교수(AI 기업 센티언트 공동창립자)는 "콘텐츠 필터를 느슨하게 만드는 조정 작업이 다른 영역의 안전장치까지 약화시킬 수 있다"고 경고했다.

논란이 확산되자 xAI는 공식 입장을 통해 "문제 게시물을 인지했으며 삭제 작업을 진행 중"이라고 밝혔다. 또한 "앞으로 혐오 표현이 X에 게시되기 전 차단하는 시스템을 강화했다"고 덧붙였다.

하지만 미국 반명예훼손연맹(ADL)은 "그록이 생성한 콘텐츠는 명백히 반유대주의적이며 무책임하고 위험하다"며 "이런 극단주의 수사는 이미 온라인에서 급증 중인 혐오를 더욱 증폭시킬 것"이라고 강력히 비판했다.

특히 이번 사태는 머스크가 불과 나흘 전 "그록을 대폭 개선했다. 확실히 차이를 느낄 것"이라고 자랑한 직후 터져 더욱 아이러니하다는 평가다.

그록의 문제는 미국을 넘어 유럽으로 확산되고 있다.

폴란드에서는 그록이 도날트 투스크 총리를 "독일과 EU에 나라를 팔아넘긴 배신자"라고 지칭했고, 일부 정치인의 외모와 사생활을 조롱하는 답변을 내놨다. 폴란드 디지털화장관은 EU 집행위에 조사와 제재를 요청하겠다고 밝혔다.

터키에서도 에르도안 대통령과 '건국의 아버지' 아타튀르크에 대한 모욕적 표현 문제로 법원이 일부 콘텐츠 차단 명령을 내렸다.

이번 사태는 AI 업계에 근본적인 질문을 던지고 있다.

기술 기업들이 '표현의 자유'를 명분으로 AI의 필터를 완화하는 것이 과연 바람직한가? AI가 혐오와 극단주의를 확산시키는 도구가 되는 것을 막으려면 어떤 규제가 필요한가?

전문가들은 "기술 혁신과 자유로운 토론이라는 가치도 중요하지만, AI가 사회적 갈등을 증폭하고 소수자를 공격하는 무기가 되어선 안 된다"고 강조한다.

머스크의 xAI는 10일 '그록4' 신규 모델 공개를 예고했지만, 안전장치 강화 없이는 논란이 재발할 것이라는 우려가 크다.

김한수 기자

hanskim@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

‘링크의 시대’에서 ‘답변의 시대’로…구글 ‘서치 라이브’가 바꾸는 검색의 질서

서치 라이브는 검색 결과를 읽는 경험보다, 검색과 ‘대화하는’ 경험에 가깝다. 사용자는 구글 앱 안에서 음성으로 질문을 이어가고, 필요하면 카메라로 사물을 비추며 실시간 도움을 받을 수 있다. 이는 검색이 단발성 쿼리에서 벗어나 문맥을 유지하는 세션형 인터페이스로 이동하고 있음을 보여준다.

‘AI’를 향한 아마존의 거대한 ‘20년 승부수’

[AI요약] 20년전 생소한 개념의 클라우드 컴퓨팅 서비스인 AWS를 출시한 후, 해당 서비스를 인터넷 기반 도구에 의존하는 거의 모든 기업에게 필수불가결한...

[AI, 이제는 현장이다③] AI가 커질수록 공격도 빨라진다… 기업 보안이 다시 ‘기본기’로 돌아가야 하는 이유

AI를 말하면서 이제 보안을 따로 떼어놓기는 어렵다. AI가 기업 전반으로 퍼질수록 공격자도 같은 기술을 손에 넣고 있기 때문이다. 문제는 공격의 방향이 완전히 새로워졌다는 데 있지 않다. 오히려 익숙한 공격이 더 빨라지고, 더 값싸지고, 더 넓게 퍼질 수 있게 됐다는 점이 더 중요하다.

‘AI 에이전트 Vs. 일상생활’ 실리콘 밸리와 대중의 격차

빅테크들이 엄청난 자금을 투입하면서 미래 기술로 보고 있는 AI를 우리는 얼마나 활용하고 있을까. AI 에이전트가 차세대 기술의 핵심으로 강조되고 있는 가운데, 미국인의 65%는 업무에 AI를 전혀 사용하지 않는 것으로 나타났다. 혁신적인 기술은 막대한 가치를 창출하지만 그 가치의 대부분은 기술을 개발하고 도입하는 기업과 투자자에게 돌아간다는 지적이 나온다.