"AI, 수학올림피아드 금메달 따고 시계는 절반만 읽는다"

스탠퍼드대 인간중심AI연구소(HAI)가 발표한 'AI 인덱스 2026' 보고서(출처=AI인덱스2026 보고서 캡쳐)

AI가 수학올림피아드에서 금메달을 따는 동안, 아날로그 시계는 두 번에 한 번만 정확히 읽는다. 스탠퍼드대 인간중심AI연구소(HAI)가 13일(현지시간) 발표한 'AI 인덱스 2026' 보고서가 그린 AI의 자화상이다.

올해 보고서에서 가장 눈에 띄는 수치 중 하나는 소프트웨어 엔지니어링 벤치마크인 SWE-벤치 베리파이드(SWE-bench Verified)의 점수 변화다. 2024년 약 60%였던 AI 최고 점수는 1년 만에 100%에 육박하는 수준으로 올라섰다. 박사급 과학 문제, 복합 추론, 수학 경시대회 영역에서도 AI는 인간 전문가와 동등하거나 그 이상의 성과를 냈다.

그러나 보고서는 이 수치를 마냥 낙관적으로 해석하지 않는다. 연구팀이 꺼낸 표현이 '들쭉날쭉한 지능(Jagged Intelligence)'이다. 특정 과업에서는 놀라운 성과를 내지만, 바로 옆 과업에서는 기초적인 실수를 반복한다는 뜻이다. 아날로그 시계 판독 정확도는 50.1%로 확률상 동전 던지기와 다르지 않다. 가정에서 옷을 개거나 설거지를 하는 등 일상 과업을 수행하는 로봇의 성공률은 12%에 불과하다.

2025년에 주요 프런티어 AI 모델 중 상당수는 이제 박사 수준의 과학 문제, 멀티모달 추론, 경시 수학에서 인간 기준을 맞추거나 넘어서고 있다.(출처=2026 AI 인덱스 리포트)

에이전트 분야에서는 개선이 두드러진다. 실제 환경 과업 처리 성공률은 지난해 20%에서 현재 77.3%로 올라섰고, 사이버보안 문제 해결률도 2024년 15%에서 93%로 급등했다. 성장하는 영역과 정체된 영역이 같은 기술 안에서 공존한다.

이 역설은 노동시장에서 가장 선명하게 나타난다. 고객 서비스 분야의 생산성은 AI 도입 이후 14%, 소프트웨어 개발에서는 26% 향상된 것으로 집계됐다. 수치만 보면 AI는 생산성의 조력자다. 그러나 고용 데이터는 다른 이야기를 한다.

'AI 인덱스 2026'에 따르면 미국의 22~25세 소프트웨어 개발자 고용은 2024년 이후 약 20% 급감했다. 같은 기간 26세 이상 개발자들의 고용은 오히려 늘었다. 스탠퍼드 경제학자들이 2025년 8월 발표한 별도 연구는 이를 보다 구체적으로 들여다봤다. 미국 최대 급여처리업체 ADP의 수천만 건 급여 데이터를 분석한 결과, AI 노출도가 높은 직종에서 22~25세 고용이 2022년 말 정점 대비 약 20% 줄었다. 연구팀은 AI가 코딩 문법·기초 알고리즘 같은 교과서식 정형 지식을 대체하는 데 특히 강하기 때문이라고 분석했다. 반면 현장 경험과 판단력이 요구되는 고연차 개발자는 AI의 직접적 영향권 밖에 있었다.

고용 감축은 이미 경영진의 계획표 안에 들어와 있다. 맥킨지앤드컴퍼니 산하 퀀텀블랙이 2025년 11월 발표한 'The State of AI' 보고서에 따르면, 조사 대상 기업의 32%가 향후 1년 내 AI로 인한 인력을 3% 이상 줄일 계획이라고 밝혔다. 서비스, 공급망 운영, 소프트웨어 엔지니어링이 주요 감축 대상 분야였다.

AI 기술이 이처럼 빠르게 고도화된 배경에는 전례 없는 투자 규모가 있다. 2025년 전 세계 기업의 AI 투자 총액은 5817억 달러(약 862조 원)로 전년 대비 130% 급증했다. 민간 투자만 따져도 3447억 달러(약 511조 원)로, 1년 전보다 127.5% 늘었다.

국가별 편차는 극단적이다. 미국의 민간 AI 투자는 2859억 달러(약 424조 원)로 2위 중국(124억 달러)의 23배에 달했다. 2025년 새로 AI 투자를 받은 기업 수도 미국이 1953곳으로 영국(172곳)의 11배를 넘겼다. 모델 생산에서도 미국 기업들이 2025년에만 주목할 만한 모델 50개를 출시했다. 중국이 30개로 격차를 좁히고 있으며, 전체 주목 모델의 90% 이상이 이제 민간 기업에서 나온다.

한국의 성적표는 두 가지 다른 숫자가 공존한다. 2024년 기준 인구 10만 명당 AI 특허 건수는 14.31건으로 세계 1위다. 룩셈부르크(12.25건), 중국(6.95건), 미국(4.68건), 일본(4.3건)을 모두 앞섰다. G20 국가 중 AI 관련 법안 제정 건수도 17건으로 25건의 미국에 이어 두 번째다.

특허의 질적 수준은 별개다. 미국 특허는 등록 후 빠르게 인용되며 미인용 비율이 19%에 그치는 반면, 한국 특허의 미인용 비율은 42%에 달한다. 건수는 세계 1위지만, 국제 연구 커뮤니티에서 실제로 참조되는 비율은 낮다는 의미다. 보고서는 인용 관행의 차이와 자국 편향 효과를 원인으로 꼽았다.

투자 규모에서의 과제도 선명하다. 한국의 민간 AI 투자는 17억8000만 달러(약 2조6000억 원)로 전 세계 12위에 그쳤다. 새로 AI 투자를 받은 국내 기업은 59곳으로 일본(56곳)을 소폭 앞선 9위였다. 보고서는 조직 차원의 AI 문해력 교육 지원과 정책·책임·보안 등 AI 관리 체계도 상대적으로 미흡하다고 평가했다.

보고서가 마지막으로 짚은 수치가 있다. AI가 일에 미치는 영향을 긍정적으로 전망하는 전문가 비율은 73%인 반면, 일반 대중은 23%에 불과하다. 50%포인트의 인식 격차다. 기술이 얼마나 빠르게 달리고 있는지, 그리고 그 달리기를 지켜보는 사람들이 얼마나 불안해하는지를 동시에 보여주는 숫자다.

정재엽 기자

anihil@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

‘적자 늪’에도 멈추지 않는 오픈AI의 쇼핑… 이번엔 금융 스타트업 ‘히로’ 삼켰다

인공지능(AI) 업계의 절대강자 오픈AI가 수익성 악화와 거센 경쟁이라는 이중고 속에서도 공격적인 ‘스타트업 쇼핑’을 멈추지 않고 있다.

회의가 곧 업무로 이어진다…줌, 클로드 연동으로 ‘AI 워크플로우’ 확장

줌이 생성형 AI 플랫폼과의 연동을 통해 회의 데이터를 ‘실행 가능한 업무’로 전환하는 흐름을 본격화한다. 단순 기록을 넘어, 회의에서 도출된 정보가 곧바로 후속 작업으로 이어지는 구조를 구축하려는 시도다.

[인터뷰] “AI는 아직 금융을 바꾸지 못했다”… 이수환 PFCT 대표가 말하는 ‘AI 렌딩테크’의 조건

금융 산업의 인공지능(AI) 도입이 언급된 지도 수년이 지났지만, 실제 현장에서 체감되는 변화는 제한적이라는 지적이 이어진다. 챗봇과 고객 응대 자동화, 일부 업무 효율화에 머무른 채 금융의 핵심인 ‘의사결정 구조’ 자체는 여전히 사람 중심으로 유지되고 있다는 것이다. 이러한 한계를 정면으로 돌파하는 기업이 피에프씨테크놀로지스(PFCT)다.

심사 없이 바로 펀딩”…와디즈, 전 과정 AI 모니터링으로 구조 전환

크라우드펀딩 플랫폼의 운영 방식이 ‘사전 심사’ 중심에서 ‘실시간 데이터 기반 관리’로 이동하고 있다. 프로젝트 공개 전 승인 절차를 거치던 기존 구조에서 벗어나, 공개 이후 전 과정을 모니터링하는 방식으로 전환이 시도되는 흐름이다.