"AI, 수학올림피아드 금메달 따고 시계는 절반만 읽는다"

2026.04.15

^{스탠퍼드대 인간중심AI연구소(HAI)가 발표한 'AI 인덱스 2026' 보고서(출처=AI인덱스2026 보고서 캡쳐)}

AI가 수학올림피아드에서 금메달을 따는 동안, 아날로그 시계는 두 번에 한 번만 정확히 읽는다. 스탠퍼드대 인간중심AI연구소(HAI)가 13일(현지시간) 발표한 'AI 인덱스 2026' 보고서가 그린 AI의 자화상이다.

올해 보고서에서 가장 눈에 띄는 수치 중 하나는 소프트웨어 엔지니어링 벤치마크인 SWE-벤치 베리파이드(SWE-bench Verified)의 점수 변화다. 2024년 약 60%였던 AI 최고 점수는 1년 만에 100%에 육박하는 수준으로 올라섰다. 박사급 과학 문제, 복합 추론, 수학 경시대회 영역에서도 AI는 인간 전문가와 동등하거나 그 이상의 성과를 냈다.

그러나 보고서는 이 수치를 마냥 낙관적으로 해석하지 않는다. 연구팀이 꺼낸 표현이 '들쭉날쭉한 지능(Jagged Intelligence)'이다. 특정 과업에서는 놀라운 성과를 내지만, 바로 옆 과업에서는 기초적인 실수를 반복한다는 뜻이다. 아날로그 시계 판독 정확도는 50.1%로 확률상 동전 던지기와 다르지 않다. 가정에서 옷을 개거나 설거지를 하는 등 일상 과업을 수행하는 로봇의 성공률은 12%에 불과하다.

^{2025년에 주요 프런티어 AI 모델 중 상당수는 이제 박사 수준의 과학 문제, 멀티모달 추론, 경시 수학에서 인간 기준을 맞추거나 넘어서고 있다.(출처=2026 AI 인덱스 리포트)}

에이전트 분야에서는 개선이 두드러진다. 실제 환경 과업 처리 성공률은 지난해 20%에서 현재 77.3%로 올라섰고, 사이버보안 문제 해결률도 2024년 15%에서 93%로 급등했다. 성장하는 영역과 정체된 영역이 같은 기술 안에서 공존한다.

이 역설은 노동시장에서 가장 선명하게 나타난다. 고객 서비스 분야의 생산성은 AI 도입 이후 14%, 소프트웨어 개발에서는 26% 향상된 것으로 집계됐다. 수치만 보면 AI는 생산성의 조력자다. 그러나 고용 데이터는 다른 이야기를 한다.

'AI 인덱스 2026'에 따르면 미국의 22~25세 소프트웨어 개발자 고용은 2024년 이후 약 20% 급감했다. 같은 기간 26세 이상 개발자들의 고용은 오히려 늘었다. 스탠퍼드 경제학자들이 2025년 8월 발표한 별도 연구는 이를 보다 구체적으로 들여다봤다. 미국 최대 급여처리업체 ADP의 수천만 건 급여 데이터를 분석한 결과, AI 노출도가 높은 직종에서 22~25세 고용이 2022년 말 정점 대비 약 20% 줄었다. 연구팀은 AI가 코딩 문법·기초 알고리즘 같은 교과서식 정형 지식을 대체하는 데 특히 강하기 때문이라고 분석했다. 반면 현장 경험과 판단력이 요구되는 고연차 개발자는 AI의 직접적 영향권 밖에 있었다.

고용 감축은 이미 경영진의 계획표 안에 들어와 있다. 맥킨지앤드컴퍼니 산하 퀀텀블랙이 2025년 11월 발표한 'The State of AI' 보고서에 따르면, 조사 대상 기업의 32%가 향후 1년 내 AI로 인한 인력을 3% 이상 줄일 계획이라고 밝혔다. 서비스, 공급망 운영, 소프트웨어 엔지니어링이 주요 감축 대상 분야였다.

AI 기술이 이처럼 빠르게 고도화된 배경에는 전례 없는 투자 규모가 있다. 2025년 전 세계 기업의 AI 투자 총액은 5817억 달러(약 862조 원)로 전년 대비 130% 급증했다. 민간 투자만 따져도 3447억 달러(약 511조 원)로, 1년 전보다 127.5% 늘었다.

국가별 편차는 극단적이다. 미국의 민간 AI 투자는 2859억 달러(약 424조 원)로 2위 중국(124억 달러)의 23배에 달했다. 2025년 새로 AI 투자를 받은 기업 수도 미국이 1953곳으로 영국(172곳)의 11배를 넘겼다. 모델 생산에서도 미국 기업들이 2025년에만 주목할 만한 모델 50개를 출시했다. 중국이 30개로 격차를 좁히고 있으며, 전체 주목 모델의 90% 이상이 이제 민간 기업에서 나온다.

한국의 성적표는 두 가지 다른 숫자가 공존한다. 2024년 기준 인구 10만 명당 AI 특허 건수는 14.31건으로 세계 1위다. 룩셈부르크(12.25건), 중국(6.95건), 미국(4.68건), 일본(4.3건)을 모두 앞섰다. G20 국가 중 AI 관련 법안 제정 건수도 17건으로 25건의 미국에 이어 두 번째다.

특허의 질적 수준은 별개다. 미국 특허는 등록 후 빠르게 인용되며 미인용 비율이 19%에 그치는 반면, 한국 특허의 미인용 비율은 42%에 달한다. 건수는 세계 1위지만, 국제 연구 커뮤니티에서 실제로 참조되는 비율은 낮다는 의미다. 보고서는 인용 관행의 차이와 자국 편향 효과를 원인으로 꼽았다.

투자 규모에서의 과제도 선명하다. 한국의 민간 AI 투자는 17억8000만 달러(약 2조6000억 원)로 전 세계 12위에 그쳤다. 새로 AI 투자를 받은 국내 기업은 59곳으로 일본(56곳)을 소폭 앞선 9위였다. 보고서는 조직 차원의 AI 문해력 교육 지원과 정책·책임·보안 등 AI 관리 체계도 상대적으로 미흡하다고 평가했다.

보고서가 마지막으로 짚은 수치가 있다. AI가 일에 미치는 영향을 긍정적으로 전망하는 전문가 비율은 73%인 반면, 일반 대중은 23%에 불과하다. 50%포인트의 인식 격차다. 기술이 얼마나 빠르게 달리고 있는지, 그리고 그 달리기를 지켜보는 사람들이 얼마나 불안해하는지를 동시에 보여주는 숫자다.

#AI 인덱스 2026 #스탠퍼드대

정재엽 기자

anihil@tech42.co.kr

기자의 다른 기사보기