지난 한 주(4월 20~26일)는 글로벌 AI 업계 역사에 기록될 만큼 발표가 밀집된 시기였다. 오픈AI가 사흘 연속으로 신제품을 내놓는 동안, 구글은 연례 클라우드 컨퍼런스에서 플랫폼 전면 개편을 단행했다. 중국의 딥시크는 기대를 모았던 차세대 모델 프리뷰를 공개하며 미중 AI 경쟁에 다시 불을 댕겼다. 사용자의 질문에 답하는 것을 넘어 AI가 스스로 업무를 설계·실행하는 '자율 에이전트' 시대가 본격 열리고 있다는 신호가 사방에서 감지됐다.
- 챗GPT 이미지 2.0, 텍스트 넣고 광고 만드는 수준까지
4월 21일 오픈AI가 공개한 이미지 생성 모델 '이미지 2.0(Images 2.0)'은 기존 달리(DALL-E) 계열과 선을 긋는 결과물을 내놨다. 가장 두드러진 변화는 텍스트 렌더링이다. 이전 모델들이 이미지 속 글자를 뭉개거나 오탈자를 내놓던 고질병을 상당 부분 해소했으며, 한국어·일본어·힌디어 등 비라틴 문자 처리 정확도도 크게 올라갔다. 오픈AI 최초로 추론 기능을 탑재해 웹 검색으로 실시간 정보를 반영하고, 단일 프롬프트에서 복수의 이미지를 동시 생성한 뒤 스스로 품질을 점검하는 기능도 갖췄다.
기술 지표상 성과는 뚜렷했다. 이미지 모델 성능 비교 플랫폼 아레나(Arena) 리더보드에서 텍스트-이미지 변환, 단일 편집, 다중 편집 세 부문 모두 1위에 올랐다. 마케팅 시안·인포그래픽·UI 목업 등 실무용 이미지 제작에 쓸 수 있는 수준이라는 평가가 개발자 커뮤니티에서 나왔다.
반응이 고른 것만은 아니었다. 딥페이크 악용과 예술가 저작권 침해 우려는 출시 직후부터 불거졌다. 퓨처럼 그룹이 2026년 1분기 기업 의사결정자 820명을 대상으로 진행한 설문에서 응답자의 55%가 AI 환각 및 신뢰성 관리를 최우선 과제로 꼽았다. 이미지 생성 AI에 대한 기업 시장의 신중론이 여전히 우세하다는 방증이다. 기존 달리2와 달리3는 오는 5월 12일 서비스가 종료된다.

- 워크스페이스 에이전트, 챗GPT가 사무실로 출근하다
이튿날인 4월 22일, 오픈AI는 챗GPT에 '워크스페이스 에이전트(Workspace Agents)'를 추가했다. 팀이 한 번 설정해두면 담당자가 자리를 비워도 AI가 업무를 이어받아 처리하는 방식이다. 기업용 협업 도구 슬랙·구글 드라이브·세일즈포스·노션 등과 연동되며, 보고서 작성·코드 실행·메시지 회신 같은 반복 업무를 일정이나 트리거에 맞춰 자동으로 처리한다. 기존 'GPT' 기능의 후속 버전으로, 오픈AI는 향후 GPT를 워크스페이스 에이전트로 전환하는 도구를 제공할 계획이라고 밝혔다.
챗GPT 비즈니스·엔터프라이즈·에듀·교사 플랜 이용자에게 리서치 프리뷰 형태로 우선 제공되며, 5월 6일까지는 무료다. 이후 크레딧 기반 유료 모델로 전환된다. 업계에서는 챗GPT가 대화형 도우미 단계를 넘어 기업 업무 실행 플랫폼으로 전환을 시도하는 선언적 행보라는 해석이 나왔다.
- GPT-5.5, "지시가 줄어도 더 많이 해낸다"
사흘째인 4월 23일에는 신모델 GPT-5.5가 출시됐다. API 접근은 추가 보안 검토를 거쳐 하루 뒤인 4월 24일 열렸다. 코딩·온라인 리서치·데이터 분석·문서 작성·소프트웨어 조작 등 복합 업무에서 지시가 적어도 스스로 계획을 세우고 끝까지 완수하는 능력을 앞세웠다. 코딩 보조 도구 커서의 마이클 트루엘 CEO는 GPT-5.4보다 눈에 띄게 스마트하고 집요하며 코딩 성능과 도구 활용 신뢰성이 향상됐다고 평가했다. 챗GPT 플러스·프로·비즈니스·엔터프라이즈 가입자가 즉시 사용할 수 있다.
- 버텍스 AI 해체하고 에이전트 전용 플랫폼으로 재편
4월 22일 라스베이거스에서 열린 '클라우드 넥스트 26(Cloud Next '26)' 컨퍼런스에서 구글은 5년 가까이 운영해온 AI 개발 플랫폼 버텍스 AI를 사실상 해체하고 '제미나이 엔터프라이즈 에이전트 플랫폼(Gemini Enterprise Agent Platform)'으로 재출범시켰다. 핵심은 '단일 창구'다. 자사 제미나이 계열 모델 외에 앤트로픽의 클로드, 오픈소스 라마까지 200개 이상의 모델을 한 곳에서 선택할 수 있는 '모델 가든(Model Garden)'을 갖췄다. 코딩 없이 에이전트를 만드는 '에이전트 디자이너'도 새롭게 선보였다.
구글 클라우드 CEO 토마스 쿠리안은 경쟁사가 "부품만 건네준다"고 직접 겨냥하며, 칩부터 애플리케이션까지 전체 AI 스택을 직접 제공하는 전략을 차별점으로 내세웠다. 파트너 생태계 지원을 위해 7억 5,000만 달러(약 1조 725억원) 규모의 펀드도 조성했으며, 액센추어·딜로이트·세일즈포스 등 글로벌 컨설팅·소프트웨어 기업들이 파트너로 합류했다.
- 에이전트 인프라 선점, 메모리 기능까지 공개 베타
앤트로픽은 이번 주 '클로드 매니지드 에이전트(Claude Managed Agents)'의 메모리 기능을 공개 베타로 전환했다. 4월 8일 출시한 이 서비스는 에이전트 운영에 필요한 샌드박스 코드 실행·세션 관리·인증 처리·추적 기능 등의 인프라를 앤트로픽이 대신 관리해주는 형태다.
기업 입장에서는 수개월씩 걸리던 에이전트 인프라 구축 작업을 생략하고 바로 업무 로직 개발에 집중할 수 있다. 요금은 기존 클로드 API 사용료에 세션당 8센트(약 115원)가 추가되는 구조로, 노션·라쿠텐 등이 이미 실서비스에 적용하고 있다.
앤트로픽이 모델을 판매하는 회사에서 에이전트 인프라 플랫폼 사업자로 무게중심을 옮기고 있다는 분석이 업계에서 나오는 배경이다.
- V4 프리뷰 공개, 화웨이 칩으로 미국 추격
1년 전 글로벌 AI 시장을 뒤흔들었던 중국 스타트업 딥시크가 4월 24일 차세대 모델 V4의 프리뷰 버전을 내놨다. 추론·에이전트 능력의 대폭 향상과 함께 '하이브리드 어텐션 아키텍처(Hybrid Attention Architecture)'라는 자체 기술을 통해 긴 대화에서도 맥락을 정확히 유지하도록 설계됐다. 코드베이스 전체나 장문 문서를 단일 프롬프트로 입력할 수 있는 100만 토큰 컨텍스트 윈도우도 지원한다. 이전 모델들과 마찬가지로 오픈소스로 공개됐다.
이번 발표에서 특히 주목받은 부분은 칩 독립 여부다. 화웨이는 자사 어센드(Ascend) AI 프로세서 기반 클러스터가 V4를 지원할 수 있다고 공식 확인했다. 카운터포인트 리서치는 V4가 미국 엔비디아 칩 없이도 구동 가능하다는 점이 중국의 AI 자립을 가속화하는 분수령이 될 수 있다고 평가했다. 다만 시장 충격의 강도에 대해서는 신중론도 있다. 모닝스타 분석가는 중국 AI가 경쟁력 있고 더 저렴하다는 사실은 이미 시장에 충분히 반영돼 있어 R1 당시와 같은 폭발적 반응을 기대하기 어렵다고 전망했다.
