OpenAI is rolling out image generation directly within ChatGPT, powered by its multimodal GPT-4o model. The new feature, called "Images in ChatGPT," is available to all users (Free, Plus, Pro, and Team), though free users are subject to usage limits similar to DALL-E 3. GPT-4o offers significant improvements in "binding" (accurate attribute-to-object matching) and text rendering, now handling 15–20 elements in one image without confusion and generating readable, typo-free text. Unlike diffusion models, this system uses an autoregressive approach, drawing images sequentially for better structure and accuracy. OpenAI demonstrated its capabilities with scientific diagrams, comics, menus, and posters, emphasizing both creativity and real-world application. While image generation is slightly slower, OpenAI believes the quality outweighs the wait. Images include C2PA metadata, and OpenAI says strong safety measures are in place, though there are no visible AI watermarks. Users own the generated images, which are free to use under OpenAI’s policies.
오픈AI가 챗GPT 내에서 직접 이미지를 생성할 수 있는 기능인 ‘Images in ChatGPT’를 도입했다. GPT-4o 모델을 기반으로 하며, 모든 구독 요금제(무료, Plus, Pro, Team)에서 사용 가능하나, 무료 사용자는 기존 DALL-E 3과 유사한 일일 생성 제한이 있다. 새 모델은 속성과 객체를 정확히 연결하는 ‘바인딩’ 능력이 크게 향상돼 15~20개 요소도 혼동 없이 처리 가능하며, 텍스트 표현 정확도도 기존보다 대폭 개선되었다. 기존 이미지 생성 모델과 달리, 자동회귀 방식을 적용해 이미지를 왼쪽 상단부터 순차적으로 생성하며, 이로 인해 텍스트와 구조 정확도가 높아졌다는 설명이다. 과학 도표, 스티커, 메뉴, 포스터 등 실용적 이미지 생성 예시도 함께 공개됐다. 오픈AI는 C2PA 메타데이터로 이미지 출처를 표기하지만, 가시적 워터마크는 없다고 밝혔다. 성적 이미지·워터마크 제거 요청 차단 등 안전장치도 갖췄으며, 생성된 이미지는 사용자 소유로, 이용 정책 내에서 자유롭게 사용할 수 있다.
