글로벌 최대 오픈 학술 논문 저장소인 ‘아카이브(arXiv)’가 거대언어모델(LLM)을 무분별하게 남용해 저품질 논문을 양산하는 학계의 ‘AI 슬롭(쓰레기 데이터)’ 관행에 칼을 빼 들었다. 아카이브 컴퓨터 과학 부문 의장인 토마스 디터리히는 인공지능이 생성한 결과물을 검증 없이 그대로 베껴 제출한 사실이 적발될 경우, 해당 저자에게 1년간 논문 게재를 전면 금지하는 강력한 제재 조치를 시행한다고 발표했다.
컴퓨터 과학과 수학 등 첨단 학문 분야에서 연구 성과 공유의 핵심 관문 역할을 해온 아카이브는 그동안 동료 심사(Peer-review) 전에 논문을 올릴 수 있다는 허점을 노린 불량 AI 논문들로 몸살을 앓아왔다. 아카이브 측은 AI가 지어낸 가짜 인용 문헌인 이른바 ‘환각(할루시네이션) 현상’이나 챗봇과 주고받은 명령어 흔적이 논문에 그대로 남아있는 경우를 명백한 부정행위의 증거로 규정했다. 이번 조치는 단 한 번의 위반으로도 자격이 박탈되는 ‘원스트라이크 아웃’ 제도로 운영된다.
이번 규제는 연구원들의 AI 활용 자체를 막는 것은 아니다. 다만 데이터의 출처나 생성 방식과 관계없이 논문에 담긴 오류와 표절, 편향성 등 모든 결과물에 대해 저자가 ‘전적인 책임’을 지도록 요구하는 취지다. 징계 처분을 받은 저자는 1년의 유예 기간이 지난 후에도 신뢰할 수 있는 학술지로부터 먼저 사전 승인을 받아야만 아카이브에 재등록할 수 있는 자격이 주어진다. 적발된 저자에게는 이의 신청을 할 수 있는 상소권이 보장된다.
