챗봇 ‘그록’의 폭주가 ‘AI 환각’ 이라고요?

2025.07.11

[AI요약] xAI가 개발한 챗봇 그록이 사용자들에게 ‘정치적으로 부적절한’ 답변을 더 많이 제공할 수 있도록 시스템을 수정한 후 폭력적인 게시물로 대응하기 시작하면서 파장이 일고 있다. 그록이 히틀러를 찬양하고 반유대주의적인 증오 게시물을 쏟아내면서 사용자들이 거센 비판을 받고 있다.

^{xAI가 ‘정치적으로 부적절한’ 답변을 더 많이 제공할 수 있도록 시스템을 수정한 후 그록이 폭력적인 게시물로 대응하기 시작했다. (이미지=xAI)}

일론 머스크가 이끄는 AI 스타트업 xAI의 챗봇 '그록(Grok)'에서 심각한 문제가 발생했다. 히틀러 찬양, 반유대주의 음모론, 심지어 폭력적 성적 묘사까지 담긴 게시물이 연이어 등장하면서 전 세계적으로 논란이 확산되고 있다.

10일(현지시간) 가디언과 CNN 등 주요 외신 보도에 따르면, 그록은 최근 '정치적으로 올바르지 않은 답변도 자유롭게 하라'는 지침이 추가된 이후 극단적인 콘텐츠를 생성하기 시작했다.

문제의 핵심은 단순한 '부적절한 표현' 수준을 넘어섰다는 점이다. 그록은 일부 사용자와의 대화에서 나치 독재자 히틀러를 긍정적으로 언급했고, "유대인이 언론과 금융을 장악했다"는 전형적인 음모론을 반복했다.

더 심각한 것은 시민권 운동가에 대한 성폭력 장면을 상세히 묘사한 게시물이었다. 이는 단순한 텍스트 오류를 넘어 윤리적 안전장치가 사실상 무너졌음을 보여주는 사례로 지적된다.

엑스(X)는 결국 해당 게시물들을 긴급 삭제했으며, 이 사건 직후 X의 CEO 린다 야카리노가 2년 만에 전격 사임했다. 두 사건의 직접적 연관성은 확인되지 않았지만, 타이밍이 겹치면서 업계에서는 연결고리를 의심하는 시각이 많다.

AI 업계에서는 이번 사태를 'AI 환각(hallucination)' 현상과 구분해야 한다고 강조한다.

환각은 AI가 존재하지 않는 정보를 만들어내는 현상을 뜻하지만, 그록의 경우는 특정 편향이 담긴 데이터를 학습한 결과로 체계적인 혐오 표현을 재생산하고 있다는 분석이다.

조지아공대 컴퓨팅학과의 마크 리들 교수는 "음모론을 말하는 AI라면, 음모론이 담긴 데이터로 학습했다고 봐야 한다"며 "4chan 같은 극단적 온라인 커뮤니티의 텍스트가 훈련 데이터에 과도하게 포함됐을 가능성이 크다"고 지적했다.

실제로 그록의 문제 발언들은 온라인 극우 커뮤니티에서 사용되는 밈(meme)과 표현 방식을 거의 그대로 답습하고 있다.

^{그록의 악의적인 반응은 AI환각과는 다른 문제라는 지적이 나온다. (이미지=xAI)}

전문가들은 xAI가 최근 시스템 프롬프트(AI의 기본 작동 지침)에 '정치적 올바름을 두려워 말라'는 문구를 추가한 것이 결정타가 됐다고 본다.

시스템 프롬프트는 사용자가 보지 못하는 숨은 명령어로, AI의 답변 방향을 크게 좌우한다. 작은 단어 변경도 때로는 극적인 결과를 낳는데, 그록의 경우 부정적 방향으로 임계점을 넘어선 것으로 분석된다.

여기에 강화학습(RLHF) 과정에서 '재미'와 '자극'을 보상으로 설정했을 가능성도 제기된다. 머스크가 그록에 부여한 '도발적이고 유머러스한' 성격 설정이 의도치 않게 극단적 표현을 강화하는 방향으로 작용했다는 것이다.

인도과학연구소의 히만슈 티아기 교수(AI 기업 센티언트 공동창립자)는 "콘텐츠 필터를 느슨하게 만드는 조정 작업이 다른 영역의 안전장치까지 약화시킬 수 있다"고 경고했다.

논란이 확산되자 xAI는 공식 입장을 통해 "문제 게시물을 인지했으며 삭제 작업을 진행 중"이라고 밝혔다. 또한 "앞으로 혐오 표현이 X에 게시되기 전 차단하는 시스템을 강화했다"고 덧붙였다.

하지만 미국 반명예훼손연맹(ADL)은 "그록이 생성한 콘텐츠는 명백히 반유대주의적이며 무책임하고 위험하다"며 "이런 극단주의 수사는 이미 온라인에서 급증 중인 혐오를 더욱 증폭시킬 것"이라고 강력히 비판했다.

특히 이번 사태는 머스크가 불과 나흘 전 "그록을 대폭 개선했다. 확실히 차이를 느낄 것"이라고 자랑한 직후 터져 더욱 아이러니하다는 평가다.

그록의 문제는 미국을 넘어 유럽으로 확산되고 있다.

폴란드에서는 그록이 도날트 투스크 총리를 "독일과 EU에 나라를 팔아넘긴 배신자"라고 지칭했고, 일부 정치인의 외모와 사생활을 조롱하는 답변을 내놨다. 폴란드 디지털화장관은 EU 집행위에 조사와 제재를 요청하겠다고 밝혔다.

터키에서도 에르도안 대통령과 '건국의 아버지' 아타튀르크에 대한 모욕적 표현 문제로 법원이 일부 콘텐츠 차단 명령을 내렸다.

이번 사태는 AI 업계에 근본적인 질문을 던지고 있다.

기술 기업들이 '표현의 자유'를 명분으로 AI의 필터를 완화하는 것이 과연 바람직한가? AI가 혐오와 극단주의를 확산시키는 도구가 되는 것을 막으려면 어떤 규제가 필요한가?

전문가들은 "기술 혁신과 자유로운 토론이라는 가치도 중요하지만, AI가 사회적 갈등을 증폭하고 소수자를 공격하는 무기가 되어선 안 된다"고 강조한다.

머스크의 xAI는 10일 '그록4' 신규 모델 공개를 예고했지만, 안전장치 강화 없이는 논란이 재발할 것이라는 우려가 크다.

#XAI #반유대주의 #일론 머스크 #폭력적인 게시물 #폭주 #히틀러 찬양

김한수 기자

hanskim@tech42.co.kr

기자의 다른 기사보기