오픈AI, 챗GPT에 이미지 생성 기능 통합… 정확도·텍스트 표현 대폭 향상

OpenAI is rolling out image generation directly within ChatGPT, powered by its multimodal GPT-4o model. The new feature, called "Images in ChatGPT," is available to all users (Free, Plus, Pro, and Team), though free users are subject to usage limits similar to DALL-E 3. GPT-4o offers significant improvements in "binding" (accurate attribute-to-object matching) and text rendering, now handling 15–20 elements in one image without confusion and generating readable, typo-free text. Unlike diffusion models, this system uses an autoregressive approach, drawing images sequentially for better structure and accuracy. OpenAI demonstrated its capabilities with scientific diagrams, comics, menus, and posters, emphasizing both creativity and real-world application. While image generation is slightly slower, OpenAI believes the quality outweighs the wait. Images include C2PA metadata, and OpenAI says strong safety measures are in place, though there are no visible AI watermarks. Users own the generated images, which are free to use under OpenAI’s policies.

오픈AI가 챗GPT 내에서 직접 이미지를 생성할 수 있는 기능인 ‘Images in ChatGPT’를 도입했다. GPT-4o 모델을 기반으로 하며, 모든 구독 요금제(무료, Plus, Pro, Team)에서 사용 가능하나, 무료 사용자는 기존 DALL-E 3과 유사한 일일 생성 제한이 있다. 새 모델은 속성과 객체를 정확히 연결하는 ‘바인딩’ 능력이 크게 향상돼 15~20개 요소도 혼동 없이 처리 가능하며, 텍스트 표현 정확도도 기존보다 대폭 개선되었다. 기존 이미지 생성 모델과 달리, 자동회귀 방식을 적용해 이미지를 왼쪽 상단부터 순차적으로 생성하며, 이로 인해 텍스트와 구조 정확도가 높아졌다는 설명이다. 과학 도표, 스티커, 메뉴, 포스터 등 실용적 이미지 생성 예시도 함께 공개됐다. 오픈AI는 C2PA 메타데이터로 이미지 출처를 표기하지만, 가시적 워터마크는 없다고 밝혔다. 성적 이미지·워터마크 제거 요청 차단 등 안전장치도 갖췄으며, 생성된 이미지는 사용자 소유로, 이용 정책 내에서 자유롭게 사용할 수 있다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

삼성, 멀미 완화 앱 '히어라피' 출시...이어폰으로 60초 들으면 2시간 효과

삼성이 이어폰으로 멀미를 완화하는 무료 앱 '히어라피'를 출시했다. 100Hz 저음 사인파를 60초간 들으면 최대 2시간 멀미 증상이 억제되며, 갤럭시 버즈4 프로 외 타사 이어폰에서도 사용 가능하다.

“남들 다 포기할 때 거꾸로 간다”… 토요타, 볼보·다임러와 ‘수소 동맹’ 전격 결성

세계 최대 자동차 기업 토요타가 전기차로 쏠린 업계 흐름에 맞서 수소 연료전지 시장에 승부수를 던졌다.

이란, 애플·구글·마이크로소프트 등 미국 기업 18곳 타격 경고

이란 혁명수비대(IRGC)가 애플·구글·마이크로소프트 등 미국 기업 18곳을 중동에서 타격하겠다고 경고했다. 4월 1일 오후 8시(테헤란 기준)를 데드라인으로 제시하며 직원 대피를 촉구했다.

음식 칼로리 계산하고 3개국어 번역까지… 메타, ‘진화한 스마트 안경’ 전격 공개”

메타가 레이밴(Ray-Ban)의 모회사 에실로룩소티카와 협력해 인공지능(AI) 기능을 대폭 강화한 차세대 스마트 안경 ‘옵틱스(Optics)’ 라인업을 선보였다.