"AI가 수학 천재를 넘어섰다"...세계 최고 수학자 30명 10분 만에 완패

세계 최고 수학자 30명이 오픈AI의 'o4-mini'와 벌인 비밀 대결에서 AI가 10분 만에 수론 난제를 해결해 충격을 안겼다고 사이언티픽 아메리칸이 보도했다.

수학자들은 AI가 풀지 못할 것으로 예상한 박사급 난제들을 출제했지만, o4-mini는 10분 만에 수론 분야의 미해결 문제를 해결해 참가자들을 경악시켰다. 버지니아대학 수학과 켄 오노 교수는 "동료들이 이 모델이 수학적 천재 수준에 접근하고 있다고 말한다"며 충격을 표현했다. AI는 먼저 관련 문헌을 2분 만에 학습한 후 간단한 '토이' 버전 문제를 풀어보며 학습하고, 최종적으로 복잡한 원문제를 정확히 해결하는 과정을 실시간으로 보여줬다. 비영리 AI 벤치마크 기관 에포크 AI(Epoch AI)가 개발한 '프론티어매스(FrontierMath)' 테스트에서 o4-mini는 20%의 문제를 해결했으며, 이는 기존 대형언어모델의 2% 대비 10배 향상된 성과다. 런던수학과학연구소의 양휘허 교수는 "매우 뛰어난 대학원생 수준이거나 그 이상"이라고 평가했으며, 수학자들은 AI가 권위적으로 답변해 "위협에 의한 증명"을 구사한다고 우려를 표했다. 오노 교수는 "일반인공지능이 오지 않을 것이라고 말하는 것은 심각한 실수"라며 "이미 대형언어모델들이 세계 최고 대학원생들을 능가하고 있다"고 경고했다.

Thirty of the world's most renowned mathematicians convened in a secret meeting in Berkeley, California in mid-May to challenge OpenAI's reasoning AI model 'o4-mini' with mathematical problems, according to Scientific American. The mathematicians devised PhD-level problems expecting to stump the AI, but o4-mini shocked participants by solving an unsolved number theory problem in just 10 minutes. University of Virginia mathematician Ken Ono stated that "colleagues literally said these models are approaching mathematical genius," expressing his astonishment. The AI demonstrated its reasoning process in real-time, first mastering related literature in two minutes, then solving a simpler "toy" version to learn, before accurately tackling the complex original problem. In Epoch AI's 'FrontierMath' benchmark test, o4-mini solved around 20% of problems, a 10-fold improvement over traditional large language models' 2% success rate. Yang Hui He from the London Institute for Mathematical Sciences evaluated it as "very, very good graduate student level—in fact, more," while mathematicians expressed concern about the AI's authoritative responses constituting "proof by intimidation." Professor Ono warned that "it's a grave mistake to say that generalized artificial intelligence will never come," noting that "large language models are already outperforming most of our best graduate students in the world."

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

삼성, 멀미 완화 앱 '히어라피' 출시...이어폰으로 60초 들으면 2시간 효과

삼성이 이어폰으로 멀미를 완화하는 무료 앱 '히어라피'를 출시했다. 100Hz 저음 사인파를 60초간 들으면 최대 2시간 멀미 증상이 억제되며, 갤럭시 버즈4 프로 외 타사 이어폰에서도 사용 가능하다.

“남들 다 포기할 때 거꾸로 간다”… 토요타, 볼보·다임러와 ‘수소 동맹’ 전격 결성

세계 최대 자동차 기업 토요타가 전기차로 쏠린 업계 흐름에 맞서 수소 연료전지 시장에 승부수를 던졌다.

이란, 애플·구글·마이크로소프트 등 미국 기업 18곳 타격 경고

이란 혁명수비대(IRGC)가 애플·구글·마이크로소프트 등 미국 기업 18곳을 중동에서 타격하겠다고 경고했다. 4월 1일 오후 8시(테헤란 기준)를 데드라인으로 제시하며 직원 대피를 촉구했다.

음식 칼로리 계산하고 3개국어 번역까지… 메타, ‘진화한 스마트 안경’ 전격 공개”

메타가 레이밴(Ray-Ban)의 모회사 에실로룩소티카와 협력해 인공지능(AI) 기능을 대폭 강화한 차세대 스마트 안경 ‘옵틱스(Optics)’ 라인업을 선보였다.