카카오브레인의 AI아티스트 ‘칼로 1.0’… 다양한 화풍으로 세상에 단 하나뿐인 이미지 생성

AI 아티스트 ‘칼로’ 모델에 제시어 입력 시 생성된 샘플 이미지. (이미지=카카오브레인)

카카오브레인이 자체 개발한 AI 아티스트 ‘Karlo(이하 칼로)’ 모델을 공개하며 초거대 AI 생태계 발전 가속화에 힘을 보탠다.

1일 카카오브레인은 입력한 제시어를 바탕으로 고품질의 이미지를 빠르게 만들어내는 AI 아티스트 ‘칼로 1.0’ 모델을 세계 최대 오픈소스 커뮤니티 깃허브(GitHub)에 공개했다고 밝혔다.

카카오브레인에 따르면 ‘칼로’는 앞서 공개한 ‘minDALL-E’, ‘RQ-Transformer’ 등 초거대 이미지 생성 AI 모델을 발전시켜 하나의 페르소나로 재탄생한 AI 아티스트다. 1.2억장 규모의 텍스트-이미지 데이터셋을 학습하여, 이해한 문맥을 바탕으로 다양한 화풍과 스타일로 세상에 단 하나뿐인 이미지를 생성할 수 있다.

예를 들어 “a man with a face of avocado, in the drawing style of Rene Magritte(르네 마그리트 화풍으로 그린 아보카도 얼굴을 한 남자)”라는 제시어를 입력하면 ‘칼로’가 제시어의 맥락을 이해하고 아보카도 얼굴을 한 남성의 모습을 르네 마그리트 화풍으로 상상하여 이미지를 그려낸다. 기존에 존재하던 이미지를 찾아내는 것이 아니라, AI가 스스로 제시어를 이해하고 직접 이미지를 생성해내는 것이다.

AI 아티스트 ‘칼로’의 활용 분야 또한 무궁무진하다.

카카오브레인 측은 “교육 및 발표 준비에 필요한 시각 자료 제작에 활용해 전달하고자 하는 메시지의 설득력을 높일 수 있고, 신규 브랜드 로고 디자인 및 구조물 디자인 등 고도의 창의성을 요하는 산업군에서 영감을 주는 예술 도구로 활용할 수도 있다”고 설명했다.

카카오브레인은 내년 초 개선된 품질과 기능이 추가된 ‘칼로’ 모델을 오픈 API 형태로 공개하며 사용자의 접근성을 높여갈 예정이다. 또한 지속적으로 텍스트-이미지 데이터셋 추가 학습을 진행하는 한편, 이미지에서 불필요한 부분을 자연스럽게 제거하거나 편집할 수 있는 ‘이미지 인페인팅(Image Inpainting)’, 기존 이미지를 보고 빛과 그림자, 주변 사물 등을 상상해 이미지를 확장할 수 있는 ‘이미지 아웃페인팅(Image Outpainting)’ 등 다양한 기능을 추가하며 모델의 성능을 고도화해 나갈 계획이다.

한편 카카오브레인은 지난 10월 AI 아티스트 ‘칼로’를 활용해 국내 최초 AI 이미지 생성 앱 ‘B^ DISCOVER’를 글로벌 시장에 무료 공개했다. 예술가들의 창작 활동을 지원하는 전문가용 버전은 내년 초 공개를 앞두고 있다.

김일두 카카오브레인 대표는 “이번에 공개한 칼로 모델로 AI 아티스트의 무궁무진한 가능성을 다방면에 활용할 수 있을 것”이라며 “앞으로도 카카오브레인은 세계적 수준의 AI 모델들을 오픈소스로 공개하며 AI 생태계 발전 가속화에 힘을 보탤 것”이라고 말했다.

황정호 기자

jhh@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

채용 공고부터 추천까지 한 번에…AI로 묶은 ‘통합 채용 허브’ 등장

잡코리아가 AI 기반 통합 채용 솔루션 ‘하이어링 센터’를 공개했다. 채용 공고 등록부터 지원자 관리, 커뮤니케이션, 운영 관리까지 전 과정을 하나의 환경에서 처리할 수 있도록 설계된 것이 핵심이다.

정답 아닌 과정 본다…AI 활용 역량, 다면 분석으로 판별

‘AI 역량평가’는 응시자가 AI를 활용해 결과를 도출하는 과정 자체를 분석한다. 프롬프트를 설계하고, AI의 응답을 검증한 뒤 이를 보완해 최종 성과로 연결하는 일련의 단계가 평가 대상이다. 단순 정답 여부가 아니라 활용 과정의 완성도를 데이터 기반으로 측정한다는 점에서 기존 평가와 차별화된다.

마이크로소프트, AI 한 명 시대 접고 ‘집단 검토’로 간다… 코파일럿 리서처에 GPT·클로드 동시 투입

마이크로소프트가 자사 업무용 AI 서비스인 마이크로소프트 365 코파일럿의 심화 조사 도구 ‘리서처’에 복수의 대형언어모델(LLM)을 함께 활용하는 구조를 도입했다.

QAI-LG전자 등 4사 맞손… ‘양자·AI 결합 데이터센터’ 시장 선점 나선다

AI 연산 폭증 속 전력·효율 한계 대응… 차세대 인프라 협력 본격화 하이브리드 퀀텀 엣지 데이터센터 공동 구축… 역할 분담 기반...