GPT-5도 피할 수 없는 AI 환각, 오픈AI "추측 유도하는 인센티브가 원인"

OpenAI released a new research paper analyzing the causes of hallucinations in large language models like GPT-5 and ChatGPT. Researchers define hallucinations as "plausible but false statements generated by language models" and acknowledge they remain a fundamental challenge for all large language models that can never be completely eliminated. When researchers asked a widely used chatbot about the title of co-author Adam Tauman Kalai's Ph.D. dissertation, they received three different wrong answers, and similarly got three different incorrect dates when asking about his birthday. The paper suggests hallucinations arise from a pretraining process that focuses on correctly predicting the next word without true or false labels attached to training statements. Researchers argue that current evaluation models don't cause hallucinations themselves but "set the wrong incentives," encouraging models to guess rather than say "I don't know" when graded only on accuracy. The proposed solution involves implementing evaluation systems similar to SAT tests that include negative scoring for wrong answers or partial credit for expressing uncertainty to discourage blind guessing. The researchers emphasize that "if the main scoreboards keep rewarding lucky guesses, models will keep learning to guess," requiring fundamental changes to accuracy-based evaluation systems.

오픈AI가 GPT-5와 챗GPT 같은 대형언어모델의 환각 현상 원인을 분석한 새로운 연구 논문을 발표했다. 연구진은 환각을 "언어 모델이 생성하는 그럴듯하지만 거짓인 진술"로 정의하며, 모든 대형언어모델의 근본적인 문제로서 완전히 제거될 수 없다고 인정했다. 연구진이 한 유명 챗봇에게 논문 공동저자인 애덤 타우만 칼라이(Adam Tauman Kalai)의 박사 논문 제목을 물어본 결과, 세 번 모두 다른 틀린 답변을 받았고 생일을 물어봤을 때도 마찬가지 결과가 나왔다. 환각 현상이 발생하는 이유는 모델이 다음 단어를 올바르게 예측하는 데 초점을 맞춘 사전 훈련 과정에서 참/거짓 라벨 없이 학습하기 때문이라고 설명했다. 연구진은 현재 평가 모델이 환각을 직접 유발하지는 않지만 "잘못된 인센티브를 설정한다"며, 모델들이 정확도만으로 평가받을 때 "모르겠다"고 답하기보다 추측하도록 유도된다고 지적했다. 해결책으로는 SAT 시험처럼 틀린 답에 대한 감점이나 불확실성 표현에 대한 부분 점수를 도입해 무분별한 추측을 억제해야 한다고 제안했다. 연구진은 "주요 점수판이 계속 운 좋은 추측에 보상을 준다면 모델들은 계속 추측하는 법을 배울 것"이라며 정확도 기반 평가 시스템의 근본적 변화가 필요하다고 강조했다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

삼성, 멀미 완화 앱 '히어라피' 출시...이어폰으로 60초 들으면 2시간 효과

삼성이 이어폰으로 멀미를 완화하는 무료 앱 '히어라피'를 출시했다. 100Hz 저음 사인파를 60초간 들으면 최대 2시간 멀미 증상이 억제되며, 갤럭시 버즈4 프로 외 타사 이어폰에서도 사용 가능하다.

“남들 다 포기할 때 거꾸로 간다”… 토요타, 볼보·다임러와 ‘수소 동맹’ 전격 결성

세계 최대 자동차 기업 토요타가 전기차로 쏠린 업계 흐름에 맞서 수소 연료전지 시장에 승부수를 던졌다.

이란, 애플·구글·마이크로소프트 등 미국 기업 18곳 타격 경고

이란 혁명수비대(IRGC)가 애플·구글·마이크로소프트 등 미국 기업 18곳을 중동에서 타격하겠다고 경고했다. 4월 1일 오후 8시(테헤란 기준)를 데드라인으로 제시하며 직원 대피를 촉구했다.

음식 칼로리 계산하고 3개국어 번역까지… 메타, ‘진화한 스마트 안경’ 전격 공개”

메타가 레이밴(Ray-Ban)의 모회사 에실로룩소티카와 협력해 인공지능(AI) 기능을 대폭 강화한 차세대 스마트 안경 ‘옵틱스(Optics)’ 라인업을 선보였다.