스탠퍼드 2026 AI 인덱스 "AI, 사회보다 빠르게 질주"…벤치마크·일자리·규제 모두 뒤처져

스탠퍼드 대학교 인간중심 AI 연구소(HAI)가 발표한 '2026 AI 인덱스'에 따르면, AI 기술은 멈출 기미 없이 빠르게 발전하고 있으며 사회 전반이 따라가기 벅찬 속도로 질주하고 있다.

2025년에 주요 프런티어 AI 모델 중 상당수는 이제 박사 수준의 과학 문제, 멀티모달 추론, 경시 수학에서 인간 기준을 맞추거나 넘어서고 있다
2025년에 주요 프런티어 AI 모델 중 상당수는 이제 박사 수준의 과학 문제, 멀티모달 추론, 경시 수학에서 인간 기준을 맞추거나 넘어서고 있다.(출처=2026 AI 인덱스 리포트)

미국과 중국의 AI 모델 성능 격차는 거의 사라졌으며, 2026년 3월 기준 앤트로픽이 선두를 달리고 xAI·구글·오픈AI가 바짝 뒤를 쫓고 있다.

소프트웨어 엔지니어링 벤치마크인 SWE-벤치 베리파이드(SWE-bench Verified)에서 AI 최고 점수는 2024년 약 60%에서 2025년 거의 100%로 뛰었고, 박사급 과학·수학·언어 이해 테스트에서 AI는 인간 전문가 수준에 도달하거나 이를 넘어섰다. 그러나 AI 역량 평가에 쓰이는 벤치마크 자체가 한계에 봉착하고 있으며, 수학 능력을 측정하는 한 주요 벤치마크의 오류율이 42%에 달하는 등 신뢰성 문제가 드러났다.

고용 시장에서는 22~25세 소프트웨어 개발자 채용이 2022년 이후 약 20% 감소한 것으로 나타났고, 맥킨지 조사에 따르면 조직의 3분의 1이 향후 1년 안에 AI로 인해 인력이 줄어들 것으로 예상했다. 전 세계 AI 데이터센터의 전력 소비량은 이미 29.6기가와트(GW)로, 미국 뉴욕주 전체 최대 전력 수요와 맞먹는 수준이다.

세계 각국 정부가 AI 규제에 나서고 있으나, 2025년 미국에서 주 단위 AI 관련 법안이 150건 통과되는 등 연방 차원의 규제 공백을 메우려는 움직임이 분주한 가운데, AI 전문가의 73%가 AI가 일자리에 긍정적 영향을 줄 것이라고 보는 반면 일반 국민은 23%에 그쳐 인식 격차가 크게 벌어졌다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

오픈AI, 앤트로픽 직격 "매출 부풀리고 컴퓨팅도 부족"…내부 메모 유출

오픈AI CRO가 앤스로픽의 300억 달러 매출이 80억 달러 부풀려졌다고 주장하는 내부 메모를 유출했다. 컴퓨팅 용량도 2030년 기준 30GW 대 7~8GW로 격차가 크다며, IPO를 앞두고 투자자 여론전이 가열되고 있다.

유튜브 프리미엄, 기습 가격 인상에 이용자 부글부글

글로벌 동영상 플랫폼 유튜브가 유료 구독 서비스인 '유튜브 프리미엄'의 미국 내 요금 인상을 전격 단행했다.

“CEO 대신 AI가 결재한다”… 메타, 마크 저커버그 ‘복제판 AI’ 전격 개발

마크 저커버그 메타 최고경영자(CEO)를 대신해 직원들과 소통하고 의사결정을 돕는 ‘AI 분신’이 조만간 현실화될 전망이다.

로블록스, 연령별 게임·채팅 강제 격리하는 ‘계정 등급제’ 도입

세계적인 메타버스 플랫폼 로블록스가 청소년 보호를 위해 플랫폼 내 게임과 기능을 연령별로 엄격히 분리하는 ‘계정 등급제’를 전격 도입한다.