알리바바 클라우드, AI 이미지 생성 모델 ‘통이 완샹’ 공개

통이 완샹을 사용한 텍스트투이미지(text-to-image) 생성 예시, 프롬프트: 밝은 색상의 무한 루프 사인에 덧붙여진 아름다운 자연 (Beautiful nature superimposed into an infinite loop sign with bright colours)을 적용했다. (이미지=알리바바 클라우드)

알리바바그룹의 디지털 기술 및 인텔리전스의 중추 알리바바 클라우드가 ‘세계 인공지능 컨퍼런스 2023(World Artificial Intelligence Conference 2023)’에서 최신 AI 이미지 생성 모델인 ‘통이 완샹(Tonyi Wanxiang)을 공개했다고 11일 밝혔다.

알리바바 클라우드에 따르면 '완샹'은 '수만 개의 이미지'라는 뜻을 지닌 중국어로, 통이 완샹은 현재 중국 내 기업 고객을 대상으로 베타 테스트가 진행 중이다.

그 외에도 알리바바 클라우드는 ‘모델스코프(ModelScope)’의 다양한 AI 모델을 활용해 언어, 시각, 음성 영역에서 복잡하고 전문적인 AI 작업을 수행할 수 있도록 지원하는 다목적 프레임워크 ‘모델스코프GPT(ModelScopeGPT)’ 또한 출시 소식을 알렸다. 알리바바 클라우드가 지난해 발표한 오픈소스 MaaS(서비스형 모델, Model-as-a-Service) 플랫폼인 모델스코프는 900개 이상의 AI 모델을 제공한다.

징런 저우(Jingren Zhou) 알리바바 클라우드 인텔리전스 CTO(최고기술책임자)는 "알리바바 클라우드는 기업과 커뮤니티가 더 큰 창의성과 생산성을 발휘할 수 있게 돕는 패러다임 전환 기술을 모색하고 있고, 이러한 가운데 통이 완샹은 고급 생성형 AI 모델을 추구하는 알리바바 클라우드의 또 다른 중요 이정표"라며 “통이 완샹은 고품질 생성 AI 이미지에 대한 접근성을 높이고 전자상거래, 게임, 디자인, 광고 등 다양한 분야에서 혁신적 AI 아트와 창의적 표현의 개발을 가능하게 할 것"이라고 말했다.

통이 완샹은 중국어나 영어 텍스트 프롬프트를 입력받아 수채화, 유화, 중국화(中國畫), 애니메이션, 스케치, 평면 일러스트레이션, 3D 만화까지 다양한 스타일의 이미지를 생성하는 등 다양한 작업을 능숙하게 처리할 수 있다. 또한 어떤 이미지든 유사한 스타일의 새로운 이미지로 변환하거나, 스타일 전송(style transfer) 기능을 통해 원본 이미지의 내용을 유지하면서 다른 그림의 시각적 스타일을 입힐 수 있다.

통이 완샹을 사용한 텍스트투이미지(text-to-image) 생성 예시, 프롬프트: 몰입적인, 매혹적인, 그레이 스케일, 고요한 만다라 숲 속의 호랑이, 선과 붓터치로 구성된 이미지 (Immersive, captivating, grayscale coloring, featuring a tiger in the tranquil mandala forest. The image is composed of lines and brushstrokes.)를 적용했다. (이미지=알리바바 클라우드)

이는 알리바바 클라우드가 보유한 지식 구조화, 시각 AI, 자연어 처리(NLP) 분야 기술을 기반으로 다국어 자료를 활용해 학습을 강화하는 것이 특징이다. 이 때문에 뛰어난 의미 이해력을 자랑하며, 정확하고 맥락에 맞는 이미지를 생성할 수 있다.

뿐만 아니라 신호 대 잡음 비(signal-to-noise ratio)를 기반으로 고해상도 확산 프로세스를 최적화해 구도의 정확도와 세부 선명도 간의 균형을 맞추는 동시에 깔끔한 배경을 지닌 고대비의 멋진 이미지를 생성할 수 있다는 것이 알리바바 클라우드의 설명이다.

특히 알이바바 클라우드 측은 “통이 완샹은 이미지 합성 품질과 창의성은 유지하면서 공간 레이아웃과 팔레트 등 최종 이미지 출력을 더욱 효과적으로 제어할 수 있는 알리바바 클라우드의 독자적 대규모 모델인 ‘컴포저(Composer)’를 이용해 개발됐다”고 강조했다.

한편, 알리바바 클라우드는 대규모 언어 모델(LLM)을 플랫폼에서 활용할 수 있도록 설계된 프레임워크인 ‘모델스코프GPT’도 공개했다. 모델스코프GPT는 LLM을 컨트롤러로 사용해 모델스코프 오픈소스 커뮤니티의 광범위한 분야별 전문 모델을 연결한다. 풍부한 MaaS 생태계 내에 구축된 모델스코프GPT는 알리바바 클라우드에서 제공하는 다양한 AI 기능을 활용한다. 기업과 개발자는 모델스코프GPT를 무료로 활용해 다국어 동영상 제작과 같이 사용자의 요청에 따른 정교한 AI 작업을 수행하는 데 가장 적합한 모델을 사용할 수 있다.

김광우 기자

kimnoba@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

PFCT, 중금리 대출 부실 예측 AI 특허 등록…에어팩 기술 독창성 인정

AI 기술금융사 피에프씨테크놀로지스(PFCT)가 금융 특화 버티컬 AI 인프라 ‘에어팩(AIRPACK)’에 적용한 중금리 대출 부실 리스크 예측 기술로 특허를 등록했다. PFCT는 이번 특허 등록을 통해 에어팩의 핵심 기술 구현 방식과 독창성을 추가로 인정받았다고 30일 밝혔다.

다쏘시스템, 파리상테 캠퍼스와 유럽 소버린 헬스케어 생태계 구축 협력

버추얼 트윈·소버린 클라우드 기반으로 디지털 헬스 스타트업 지원 3D익스피리언스 랩·OUTSCALE 프로그램 연계해 아이디어 단계부터 산업화까지 지원 다쏘시스템이 프랑스 디지털 헬스...

5G냐 LTE냐, 이제 몰라도 된다...통신 3사 '통합요금제' 전환 완료 수순

LGU+가 6월 1일 통합요금제를 선제 출시한 데 이어 KT·SKT도 7월 합류한다. 수백 종 요금제가 16~18종으로 줄고, 월 2만원대 저가 요금제에도 데이터 안심 옵션이 기본 적용된다. 소비자가 알아야 할 핵심 변화 정리.

'메모리 칩 하나로 메타·테슬라 밟았다'…마이크론, AI 광풍에 시총 1.4조 달러 돌파

오래전 PC 성능을 끌어올리려던 이들이 찾던 작은 메모리 카드 제조사가 실리콘밸리의 거대 공룡들을 제치고 섰다. 아이다호주 보이시에 본사를 둔 메모리 반도체 제조업체 마이크론 테크놀로지(Micron Technology)가 6월 25일 장중 시가총액 1조 3980억 달러를 기록하며 메타(Meta)의 1조 3920억 달러와 테슬라(Tesla)를 순간적으로 추월했다.