하버드대 연구팀이 오픈AI의 AI 모델이 응급실 초기 진단에서 의사보다 높은 정확도를 보였다는 연구 결과를 학술지 사이언스에 발표했다.
연구팀은 오픈AI의 추론 모델 'o1 프리뷰(o1 preview)'를 보스턴 소재 병원 응급실의 실제 76개 케이스에 적용해 성능을 평가했다. AI는 정확하거나 근접한 진단을 67% 케이스에서 내놓은 반면, 인간 의사들의 정확도는 50~55%에 그쳤다. 치료 계획 수립 실험에서는 AI가 89%, 기존 검색 도구를 활용한 의사 46명이 34%를 기록해 격차가 더욱 두드러졌다.
연구를 이끈 아르준 만라이 교수는 "AI가 의사를 대체한다는 의미가 아니며, 더 나은 의료 도구로 활용하기 위한 임상시험이 시급하다"고 강조했다.
연구팀은 현재 AI 평가가 텍스트 기반 데이터에만 국한돼 있으며, 실제 임상에서는 X선·심전도 등 다양한 데이터가 함께 활용된다는 점을 한계로 꼽았다.
전문가들은 이번 결과를 "AI 임상 추론의 실질적 진전"으로 평가하면서도, AI 의료 기업들이 결과를 과장 해석해 의사의 역할을 축소하려 할 수 있다고 경고했다.

