스탠퍼드 2026 AI 인덱스 "AI, 사회보다 빠르게 질주"…벤치마크·일자리·규제 모두 뒤처져

스탠퍼드 대학교 인간중심 AI 연구소(HAI)가 발표한 '2026 AI 인덱스'에 따르면, AI 기술은 멈출 기미 없이 빠르게 발전하고 있으며 사회 전반이 따라가기 벅찬 속도로 질주하고 있다.

2025년에 주요 프런티어 AI 모델 중 상당수는 이제 박사 수준의 과학 문제, 멀티모달 추론, 경시 수학에서 인간 기준을 맞추거나 넘어서고 있다
2025년에 주요 프런티어 AI 모델 중 상당수는 이제 박사 수준의 과학 문제, 멀티모달 추론, 경시 수학에서 인간 기준을 맞추거나 넘어서고 있다.(출처=2026 AI 인덱스 리포트)

미국과 중국의 AI 모델 성능 격차는 거의 사라졌으며, 2026년 3월 기준 앤트로픽이 선두를 달리고 xAI·구글·오픈AI가 바짝 뒤를 쫓고 있다.

소프트웨어 엔지니어링 벤치마크인 SWE-벤치 베리파이드(SWE-bench Verified)에서 AI 최고 점수는 2024년 약 60%에서 2025년 거의 100%로 뛰었고, 박사급 과학·수학·언어 이해 테스트에서 AI는 인간 전문가 수준에 도달하거나 이를 넘어섰다. 그러나 AI 역량 평가에 쓰이는 벤치마크 자체가 한계에 봉착하고 있으며, 수학 능력을 측정하는 한 주요 벤치마크의 오류율이 42%에 달하는 등 신뢰성 문제가 드러났다.

고용 시장에서는 22~25세 소프트웨어 개발자 채용이 2022년 이후 약 20% 감소한 것으로 나타났고, 맥킨지 조사에 따르면 조직의 3분의 1이 향후 1년 안에 AI로 인해 인력이 줄어들 것으로 예상했다. 전 세계 AI 데이터센터의 전력 소비량은 이미 29.6기가와트(GW)로, 미국 뉴욕주 전체 최대 전력 수요와 맞먹는 수준이다.

세계 각국 정부가 AI 규제에 나서고 있으나, 2025년 미국에서 주 단위 AI 관련 법안이 150건 통과되는 등 연방 차원의 규제 공백을 메우려는 움직임이 분주한 가운데, AI 전문가의 73%가 AI가 일자리에 긍정적 영향을 줄 것이라고 보는 반면 일반 국민은 23%에 그쳐 인식 격차가 크게 벌어졌다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

오픈AI, 실시간 음성 AI 3종 공개...추론·번역·전사 모델

오픈AI가 GPT-5급 추론·실시간 번역·라이브 전사 기능을 갖춘 음성 AI 모델 3종을 API로 공개했다. 컨텍스트 윈도우 4배 확장, 질로우·도이치텔레콤 등이 이미 테스트 중이다.

구글, 헬스 데이터 통합한 ‘구글 헬스’ 전격 출범

구글이 웨어러블 기기 브랜드 ‘핏비트(Fitbit)’ 앱을 자사의 건강 데이터를 총망라한 통합 포털인 ‘구글 헬스(Google Health)’로 전격 개편한다.

메타, 인스타그램 전용 쇼핑 AI 에이전트 ‘해치’ 개발

메타가 인스타그램과 외부 앱을 넘나들며 사용자의 업무와 쇼핑을 대행하는 차세대 AI 에이전트 개발에 박차를 가하고 있다.

"애플 카메라 내장 에어팟, 고도화 테스트"...사진 촬영 아닌 AI 시각 정보 전용

애플이 카메라 내장 에어팟 프로토타입을 DVT 단계까지 진행했다. 사진 촬영 아닌 AI 시각 정보 전용으로, 차세대 시리와 함께 9월 출시 가능성이 거론된다.