[위클리 AI] "듣고, 추론하고, 대신 일한다"...한 주에 쏟아진 AI 신기능

2026.05.12

지난 5월 첫 주(4~10일), 오픈AI·앤트로픽·구글·메타·xAI 등 주요 AI 기업들이 신규 서비스와 기능 업데이트를 잇달아 내놨다. 에이전트·음성 인터페이스·규제 대응이 이번 주 AI 업계의 핵심 화두로 부상했다.

오픈AI, 실시간 음성 AI 3종 공개…추론·통역·전사 기능 한 번에

오픈AI는 5월 7일(현지시간) 개발자용 리얼타임 API를 통해 실시간 음성 모델 3종을 동시에 공개했다. 이번 발표와 함께 리얼타임 API는 베타 딱지를 떼고 정식 서비스로 전환됐다.

핵심 모델인 GPT-리얼타임-2는 GPT-5급 추론 능력을 음성 영역에 처음 적용한 모델이다. 사용자가 말을 끊거나 앞서 한 말을 고쳐도 문맥이 끊기지 않으며, 처리 가능한 정보량이 기존의 4배인 12만8,000토큰으로 늘었다. 개발자는 서비스 성격에 따라 AI의 추론 깊이를 5단계로 조절할 수 있다. 부동산 플랫폼 질로는 이 모델로 음성 주택 검색·투어 예약 에이전트를 구축 중이며, 가장 까다로운 자체 기준점에서 통화 성공률이 69%에서 95%로 26%포인트 올랐다고 밝혔다.

실시간 통역 전담 모델인 GPT-리얼타임-트랜슬레이트는 70개 이상의 입력 언어를 13개 출력 언어로 화자 속도에 맞춰 즉시 변환한다. 도이치텔레콤은 다국어 고객 지원에, 비디오 플랫폼 비메오는 영상 실시간 번역에 도입을 추진 중이다. 여행 플랫폼 프라이스라인은 세 모델을 조합해 항공·호텔 예약부터 현지 통역까지 음성 하나로 처리하는 서비스를 개발하고 있다.

GPT-리얼타임-위스퍼는 말하는 순간 동시에 텍스트를 생성하는 저지연 전사 모델로, 라이브 자막·회의록 자동화 분야를 겨냥했다. 가격은 트랜슬레이트가 분당 0.034달러(약 49원), 위스퍼가 분당 0.017달러(약 24원)다.

MS 코파일럿, GPT-5.5 Instant 탑재…"빠르고 간결하게"

마이크로소프트는 같은 날인 5월 7일 업무용 AI 도구 '코파일럿'에 오픈AI의 GPT-5.5 인스턴트를 탑재했다. 이미지 분석과 이공계 업무 처리 능력을 끌어올리면서 응답 길이는 줄인 버전으로, MS 365 유료 라이선스 사용자가 우선 이용할 수 있다. 코파일럿 스튜디오 얼리 릴리스 환경과 개발자 플랫폼 MS 파운드리에도 함께 제공된다.

앞서 4월 27일에는 심층 추론 기능인 GPT-5.5 씽킹과 이미지 생성 기능 챗GPT 이미지 2.0도 추가됐다. 씽킹은 워드·엑셀·파워포인트에 순차 적용 중이며, 이미지 2.0은 파워포인트에 먼저 붙었다. 업무용 AI 구독 매출과 직결되는 오피스 생태계 전반에 최신 모델이 단계적으로 이식되는 형국이다.

xAI, 그록 4.3 API 전면 개방…"가격은 낮추고 기능은 높였다"

일론 머스크의 AI 스타트업 xAI는 5월 5일 추론 모델 그록 4.3의 API를 개발자에게 공식 개방했다. 4월 17일 월정액 $300짜리 최상위 구독자에게만 먼저 선보인 뒤 단계적으로 접근을 허용해 온 모델이다.

이번 전면 공개의 핵심은 가격 인하다. 입력 토큰 가격을 전작 대비 약 40% 낮춰 100만 개당 1.25달러(약 1,790원), 출력은 100만 개당 2.50달러(약 3,580원)로 책정했다. 처리 가능한 문서량도 약 2,000페이지 분량인 100만 토큰 수준으로 늘었고, 영상 입력도 새로 지원한다. 미국 AI 스타트업 Abacus AI의 CEO는 클로드 소넷 4.6과 비슷한 성능을 5배 낮은 비용으로 쓸 수 있다고 평가했다. 다만 코딩 성능은 클로드 오퍼스 4.7 대비 약 14%포인트 낮다는 독립 벤치마크 결과도 나온다.

구글·메타, 개인형 AI 에이전트 사내 테스트…유통 전쟁 본격화

구글은 5월 4일 브라우저 에이전트 실험인 마리너(Mariner) 프로젝트를 공식 종료하고 관련 기술을 제미나이 에이전트에 흡수시켰다. 동시에 코드명 'Remy(레미)'로 불리는 개인형 AI 에이전트를 임직원 사내 테스트 단계에 올렸다. 공식 공개 시점은 5월 19~20일 열리는 구글 I/O 2026이 유력하다.

메타도 코드명 '해치(Hatch)'라는 에이전트를 개발 중이다. 파이낸셜타임스(FT)는 5월 5일 보도에서 해치가 인스타그램·페이스북·왓츠앱 등 메타 전 플랫폼에 걸쳐 수십억 명의 일상 업무를 처리하는 초개인화 비서로 기획됐다고 전했다. 현재는 앤트로픽 클로드 모델로 구동 중이나 출시 시에는 자체 모델 뮤즈 스파크(Muse Spark)로 교체할 계획이다. 두 회사 모두 AI 모델 성능보다 플랫폼 접근성과 사용자 규모에서 우위를 점하겠다는 전략이 뚜렷하다.

앤트로픽, 클로드 코워크에 '오빗' 탑재 준비…묻기 전에 먼저 알려준다

앤트로픽의 업무 자동화 플랫폼 클로드 코워크에 '오빗(Orbit)'이라는 신기능이 코드 내 설정 토글 형태로 발견됐다. 지메일·슬랙·깃허브·피그마·캘린더·드라이브를 연결해 사용자가 요청하지 않아도 맞춤형 업무 브리핑을 능동적으로 제공하는 방식이다. 5월 6일 샌프란시스코에서 열린 '코드 위드 클로드' 개발자 행사에서 처음 주목받았다. 개발자·제품관리자·디자이너 중심의 코워크 이용자를 주요 타깃으로 한 것으로, 공식 출시는 아직 미정이다.

미 정부, AI 모델 출시 전 평가 체계 본격화

미국 상무부 산하 AI표준혁신센터(CAISI)는 5월 5일 구글 딥마인드·마이크로소프트·xAI와 AI 모델 배포 전 평가 협약을 맺었다고 공식 발표했다. 앤트로픽의 사이버보안 특화 모델 클로드 미토스가 백악관과 정보기관의 이목을 집중시킨 직후 나온 조치다. 앤트로픽과 오픈AI는 2024년에 이미 유사한 협약을 맺은 바 있어, 이번 합류로 주요 AI 업체 전반에 걸친 사전 검증 체계가 완성됐다.

#AI #GPT #제미나이 #클로드

정재엽 기자

anihil@tech42.co.kr

기자의 다른 기사보기