정치 질문 회피율 30% vs 96% 응답… AI 챗봇 '발언의 자유' 격차 충격

2025.04.17

[AI요약] 챗GPT와 그록 등 인기있는 AI챗봇들은 민감한 정치적 비판, 시민권 및 시위 관련 질문 등 민감하고 논란의 여지가 있는 주제를 어떻게 처리하고 있을까. 흥미로운 테스트 결과에 따르면, 오픈AI의 최신 모델들은 시간이 지남에 따라 정치적으로 민감한 문제에 대한 허용범위가 줄었지만, xAI는 오히려 그러한 질문에 기꺼이 대답하는 모델을 선보이고 있다.

AI가 논란의 여지가 있는 질문에 얼마나 자유롭게 답변하는지 측정하는 평가 도구가 등장해 업계가 술렁이고 있다. 'xlr8harder'라는 닉네임의 익명 개발자가 14일(현지시간) 'SpeechMap(스피치맵)'이라는 이름의 오픈 테스트 플랫폼을 X(트위터)에 공개했다.

이 툴이 주목받는 이유는 단순하다. 같은 질문에 대해 AI 챗봇마다 답변을 회피하거나 거부하는 빈도가 천차만별로 나타났기 때문이다.

34개 AI 모델, 6만5000건 응답 분석… 그록만 96% 응답

스피치맵은 34개 주요 AI 모델을 대상으로 6만5000개 이상의 응답을 수집·분석했다. 테스트 프롬프트는 정치적 비판, 시민권 이슈, 시위 관련 질문, 역사 서사, 국가 상징 등 민감한 주제를 광범위하게 포함한다.

응답은 ▲완전 응답 ▲회피적 답변 ▲답변 거부 세 가지로 분류됐다. 전체 평균 완전 응답률(compliance rate)은 71.3%였다. 그러나 모델별 편차가 극심했다.

일론 머스크의 xAI가 만든 '그록(Grok) 3'는 96.2%의 완전 응답률을 기록해 압도적 1위를 차지했다. 반면 오픈AI의 GPT 모델군은 평균 60% 초반대에 그쳤다.

"보수 견해 검열" 논란 속… 오픈AI, 시간 지날수록 답변 회피

스피치맵 데이터가 더욱 논란이 된 이유는 오픈AI 모델의 시계열 변화를 추적한 결과 때문이다. 오픈AI는 출시 모델을 거듭할수록 정치 관련 질문에 대한 응답을 점점 더 제한하는 방향으로 모델을 조정한 것으로 확인됐다.

이번 주 출시한 GPT-4.1 모델군은 직전 모델 대비 응답 허용 범위가 약간 넓어졌지만, 2023년 이전 출시 모델들보다는 여전히 낮은 수준이다. 개발자는 "모델이 업데이트될 때마다 정치적 질문에 대한 가드레일(guardrail)이 강화되는 추세가 뚜렷하다"고 분석했다.

이는 최근 미국 정치권의 'AI 검열 논란'과 맞물려 있다. 도널드 트럼프 대통령 측근인 일론 머스크와 데이비드 삭스 백악관 AI·암호화폐 차르(czar)는 공개적으로 "챗봇이 보수적인 견해를 검열한다"고 주장해왔다.

메타는 '라마' 조정 선언, 오픈AI는 '중립' 강조했지만…

실제로 메타는 최신 대형언어모델(LLM) 라마(Llama) 시리즈를 출시하면서 "특정 견해를 다른 견해보다 우선시하지 않고, 더 논란의 여지가 있는 정치적 질문에도 응답하도록 조정했다"고 공식 발표한 바 있다.

오픈AI도 지난 2월 향후 모델을 "다양한 관점을 제공하되 편집자적 입장을 취하지 않는 방향"으로 설계할 것이라고 밝혔다. 이는 트럼프 행정부의 정책 기조에 맞춘 조치로 해석된다.

그러나 스피치맵 데이터는 오픈AI가 이번 업데이트에서 미세하게 방향을 튼 것은 사실이지만, 여전히 '회피형 AI'에 가깝다는 평가를 내렸다.

xAI 그록은 정반대 전략… "깨어있음(woke) 반대" 표방

반면 머스크의 xAI는 처음부터 정반대 전략을 취했다. 머스크는 2023년 그록을 처음 발표할 때 "과감하고, 여과되지 않았으며, '깨어있음(woke)'에 반대하는 모델"이라고 강조했다.

여기서 'woke'는 미국 정치 맥락에서 좌파적·진보적 성향을 비판적으로 지칭하는 은어다. 즉, 그록은 다른 AI 시스템이 대답하지 않는 논란의 여지가 있는 질문에도 기꺼이 답하겠다는 것을 처음부터 정체성으로 내세운 것이다.

다만 초기 그록 모델(1.0~2.0)은 실제로는 정치적 주제에 대해 상당히 회피적이었던 것으로 알려졌다. 2024년 한 독립 연구에서는 그록이 트랜스젠더 권리, 다양성 프로그램, 불평등 같은 주제에서 오히려 좌파 성향을 보였다는 분석 결과가 나오기도 했다.

이에 대해 머스크는 "훈련 데이터, 즉 공개 웹페이지가 좌편향이었기 때문"이라며 그록을 '정치적 중립'에 가깝게 개발하겠다고 약속했다. 그 결과물이 이번 그록 3다.

"언어 모델은 발언 인프라… 표현의 자유 평가 필수"

개발자는 이번 실험의 의의를 다음과 같이 설명했다.

"언어 모델은 이제 대중의 발언을 위한 인프라가 되고 있다. 이는 강력한 발언 지원 기술이지만, 동시에 발언을 제한할 수 있는 잠재적 기술이기도 하다. AI가 21세기의 언어 활성화 기술을 선도할 것이라고 믿는다면, 표현의 자유와 공정성이 보장되는 미래를 원한다면, 이런 시스템이 어떻게 작동하고 어디까지 한계를 정하는지 반드시 알아야 한다."

그는 또한 "이런 종류의 토론은 기업 본사 내부가 아니라 공개적으로 이루어져야 한다고 생각해 누구나 직접 데이터를 탐색할 수 있도록 사이트를 구축했다"고 덧붙였다.

평가 도구의 한계… "노이즈·편향 가능성 인정"

다만 개발자는 테스트의 한계도 솔직하게 인정했다. AI 모델 제공업체의 오류로 인한 '노이즈', 판단에 사용한 AI 모델 자체에 포함될 수 있는 편향 등이 결과에 영향을 미쳤을 가능성이 있다는 것이다.

그는 "이 프로젝트가 선의로 개발됐고 데이터가 정확하다고 가정한다면, 스피치맵은 몇 가지 흥미로운 트렌드를 보여준다"며 신중한 해석을 당부했다.

오픈AI의 최신 모델들은 시간이 지남에 따라 정치적으로 민감한 문제에 대한 질문을 피하거나 중립적으로 대답하는 반면 xAI의 그록은 점점 더 과감하게 답변하고 있다. (이미지=오픈AI)

트럼프 행정부 "AI 검열 금지" 행정명령 추진 중

이번 스피치맵 공개는 미국 백악관이 'woke AI' 규제 행정명령을 준비 중인 시점과 맞물려 더욱 주목받고 있다. 월스트리트저널은 지난 1월 "트럼프 행정부가 '깨어있는' AI 모델에 대응하기 위한 행정명령을 준비 중"이라고 보도한 바 있다.

정부효율부를 이끄는 머스크는 오픈AI를 "보수 견해를 검열한다"며 공개 비판해왔고, 이번 스피치맵 결과는 그의 주장에 일정 부분 근거를 제공하는 셈이 됐다.

다만 일각에서는 "AI가 사실에 기반한 답변을 하는 것과 정치적 검열을 하는 것은 구분해야 한다"며 "정치적 중립을 명분으로 허위 정보나 혐오 발언까지 허용하는 것은 위험하다"는 반론도 제기되고 있다.

AI 발언의 자유 vs 책임 있는 AI… 업계 고민 깊어져

스피치맵의 등장은 AI 업계가 직면한 근본적 딜레마를 드러낸다. '발언의 자유'를 최대한 보장할 것인가, 아니면 사회적 책임과 안전을 우선할 것인가?

오픈AI는 후자 쪽에, xAI는 전자 쪽에 무게를 실었다. 그 결과 응답률에서 30%포인트 이상의 격차가 발생했다.

향후 이 격차가 AI 시장에서 어떤 방식으로 작용할지, 그리고 정부 규제가 어느 쪽을 지지할지가 업계의 관전 포인트다.

#그록 #스피치맵 #오픈AI #챗GPT

류정민 기자

znryu@daum.net

기자의 다른 기사보기