10년차 뉴스 앵커가 AI 아바타 회사를 창업한 이유는?

박철민 에이아이파크 대표, 과학 프로그램 진행 중 멘토 말 듣고 AI 대학원 과정 밟아
국내 첫 가상인간 AI앵커 ‘제나’, 본인을 본뜬 AI 아나운서 AI박... 결실 이어져
AI 아바타 기술 고도화를 통해 영상 미디어 분야의 혁신 이뤄 낼 것
박철민 에이아이파크 대표는 방송 앵커이자 스타트업 대표라는 두 가지 삶을 살아가고 있다. (사진=에이아이파크)

최근 ‘AI 아나운서’ 기술로 주목받고 있는 AI(인공지능) 미디어 스타트업 에이아이파크는 2020년 4월 21일 설립됐다. 굳이 의미를 부여하자면 ‘과학의 날’에 탄생한 회사인 셈이다. 더욱 관심을 끄는 것은 이 회사의 대표가 다름 아닌 박철민 전 TBS 앵커라는 사실이다. 물론 그는 여전히 여러 프로그램에서 방송활동을 이어가고 있다. 에이아이파크 대표는 이른바 ‘부캐(부 캐릭터)’인 셈이다.

언뜻 방송인의 투잡 정도로 오해할 수 있지만, 창업자로서 박 대표가 쏟는  열정과 노력은 여느 스타트업 대표와 다름이 없다. 에이아이파크를 창업하기 전까지는 그가 택한 것은 ‘정공법’이다. 2019년 연세대학교 공학대학원 인공지능 전공 1기로 입학해 전문 지식을 쌓았다. 이후 2020년 3월 창업사관학교 10기로 입교해 한 달가량 창업 트레이닝을 거친 후 에이아이파크를 창업했다.

“예전에 ‘YTN사이언스’ 채널에서 ‘사이언스 투데이’라는 프로그램을 하면서 패널 중 한 분인 김상선 한양대 교수님(전 한국과학기술기획평가원 원장)이 입버릇처럼 말씀하신 ‘융합하세요’라는 말에 영향을 많이 받았어요. 교수님 덕분에 실제 대학원에 진학할 결심도 했고요. 그렇게 인공지능 전공에 입학하면서 썼던 학업계획서 주제가 ‘인공지능 아나운서’였어요(웃음). 그것을 좀 더 구체화 시킨 것이 사업계획서가 됐죠. 돌이켜 보면 창업이 이렇게 힘든 일인 줄 모르고 시작한 것 같아요. 앵커, 아나운서로서 회사에 소속돼 있을 때 하고는 매 순간이 달라요. 대표라는 책임감, 역할의 무게도 느끼고 있죠. 처음에는 공용 사무실에 책상 2개를 놓고 시작한 것이 지금은 20명 정도가 일할 수 있는 규모로 커졌어요. 직원이 늘어날수록 책임감은 더 커지더군요.”

짧다면 짧고 길면 긴 2년여의 시간 동안 박 대표를 중심으로 한 에이아이파크의 성과는 끊임없이 이어졌다. ‘전자장치 및 텍스트 기반 영상 생성법’ 국내·외 특허 출원에 이어 ‘KDX 인공지능 데이터 해커톤’ 최우수상 수상, 한국언론진흥재단 2021 미디어 스타트업 최우수상 수상 등 무수한 대회에서 연이어 수상을 거듭했다.

올해에는 KBS, JTBC 등 주요 방송 매체와 업무 협약을 체결하고 국내 첫 가상인간 AI앵커 ‘제나’ 박 대표 본인을 본뜬 AI 아나운서 'AI박'을 본격 선보이며 화제를 모으기도 했다. 지난 5월에는 중소벤처기업부 주관 기술창업지원 프로그램 팁스(TIPS)에 선정되며 다시금 기술력을 인정받기도 했다.

에이아이파크가 나아갈 길은 이제 시작에 불과하다. 박 대표는 향후 AI 아바타 기술 고도화를 통해 방송 콘텐츠를 제작할 수 있는 미디어 서비스를 목표로 하고 있다. 점점 더 흥미로워지는 계획이 아닐 수 없다. 다음달 6일 ‘콘텐츠 마케팅 인사이트’에서 ‘10년차 뉴스 앵커가 AI 앵커로 창업한 이야기’를 주제로 강연에 나서기도 하는 박 대표를 만나 그 이야기를 먼저 들어봤다.

대본만 있으면 언제 어디서든 AI 앵커 활용 가능

최근 에이아이파크에서 제작한 국내 첫 가상인간 AI 앵커 '제나'는 JTBC를 통해 성공적인 데뷔를 했다. (이미지=에이아이파크)

에이아이파크의 대표 서비스는 글로벌 버추얼 AI 아바타 제작 앱 ‘아이바타(AiVATAR)'다. 미리 작성된 텍스트, 즉 대본만 입력하면 영상에서 AI 아나운서로 분한 아바타가 등장해 해당 내용을 술술 전달한다. 더욱 놀라운 것은 AI 아나운서가 구사하는 언어가 한국어 외에도 영어, 일본어, 중국어, 베트남어, 인도네시아어 등 20여 개의 언어에 달한다는 점이다.

“쉽게 방송에서의 아나운서 역할을 생각해 보시면 됩니다. 일단 대본이라는 텍스트가 있어야죠. 그 다음 대본을 읽는 음성, 영상에서 나타나는 얼굴이 필요하고요. 이 세 가지가 AI 아나운서, AI 아바타를 만드는데 필수적인 데이터라 할 수 있어요.”

그렇다면 새로운 AI 아바타를 만드는 것은 어떨까? 에이아이파크의 AI 아바타 기술은 크게 영상합성기술과 음성합성기술로 구분된다. 특히 TTS(Text to speech)로 불리는 음성합성기술은 인공지능이 특정화자가 읽은 글자와 그걸 읽은 음성 데이터, 즉 음성 파일을 학습 데이터로 해서 적게는 몇 천 개 많게는 몇 만 문장을 학습하는 과정을 거친다. 영상합성기술의 경우는 페이스 제너레이션 기술의 일종으로, 인공지능이 말하는 사람의 표정, 입모양, 하관의 움직임과 같은 말습관을 학습하고 음성신호와 연계해 영상으로 출력하는 과정을 거친다.

박 대표는 “최소 1시간에서 4시간 정도의 음성 데이터, 3분 정도의 말하는 얼굴 영상 데이터만 있으면 하루면 새로운 AI 아바타를 만들 수 있다”고 설명했다.

“저는 AI 아바타가 만들어지는 과정을 세탁기에 비유해요(웃음). 세탁량이 얼마나 되느냐에 따라 시간이 걸리는 거죠. 물론 데이터 량이 많을수록 만들어지는 AI 아바타의 퀄리티도 높아집니다.”

AI 아바타로 수익 창출도 가능하다고?

박철민 대표를 모델로 만든 AI 아바타. 실제 인물과 큰 차이를 느낄 수 없다. (이미지=에이아이파크)

박 대표는 에이아이파크의 기술력을 바탕으로 AI 아바타 제작, 매니지먼트 등의 수익 모델을 구상하고 있다. AI 아바타 하나를 만드는데 적잖은 솔루션 비용이 들어가는 만큼 기업 등에서 AI 아바타를 만들고, 해당 기업을 제작된 AI 아바타를 매니지먼트하며 수익을 창출할 수 있다는 것이다. 그 과정에서 창출되는 수익은 AI 아바타의 모델이 된 실제 인물에게도 일정 부분 돌아갈 수 있다는 것이 박 대표의 설명이다.

“AI 아바타 솔루션을 제공하는 저희, 그리고 비용을 투입해 AI 아바타를 만들어 매니지먼트하는 기업, AI 아바타의 실제 인물 등이 각각 수익을 거둘 수 있어요. 유튜버나 프리랜서 방송인 등 개인의 경우도 수익 모델을 만들 수 있죠. 이를테면 저희가 무상으로 AI 아바타를 제작해 드리고, AI 아바타 활동에 따른 수익을 실제 인물과 분배하는 방식이에요. 일종의 저작권처럼 저희와 실제 인물 모두 수익을 얻을 수 있는 방식이라 할 수 있죠.”

박 대표는 이러한 수익 모델을 몸소 증명하기도 했다. 언젠가 부산에 출장을 갔을 당시 드라마 앵커 역할의 녹음 의뢰가 들어와 이미 만들어 둔 자신의 AI 아바타를 활용했다는 것이다. 물론 비용은 자신이 직접 했을 때보다 저렴하게 적용했다. 사용자 입장에서도 적은 비용으로 큰 차이가 없는 결과물을 얻을 수 있게 되니 나쁘지 않은 방식인 셈이다.

양날의 검과 같은 기술, 악용에 대비한 장치도 고려 중

음성과 얼굴 데이터만 있으면 아바타를 만들어 낼 수 있다는 점은 잘만 활용하면 혁신을 가져올 수 있지만, 악용될 가능성도 고려할 필요가 있다. 이미 AI 아바타 제작 방식과 유사한 ‘딥페이크’ 기술로 일반인의 얼굴사진과 성착취물을 합성해 유포하는 범죄가 발생하고 있고, 이로 인해 2020년 6월에는 불법합성물 제작·유포에 대한 처벌 규정을 담은 성폭력범죄의 처벌 등에 관한 특례법 개정안이 시행되고 있다.   

박 대표 역시도 “법적인 문제로 해결될 수도 있지만, 기술적인 부분에서는 그 기술을 영위하고 있는 기업들이 책임감을 갖고 예방할 수 있는 장치를 마련할 필요가 있다”며 말을 이어갔다.

박철민 대표의 AI 아바타로 만든 뉴스 화면 영상. 하지만 AI 아바타 기술이 고도화될 수록 범죄에 악용될 수 있다는 우려도 커지는 것이 사실이다. 이에 대해 박 대표는 기술적으로 예방이 가능한 몇 가지 아이디어를 언급하기도 했다. (영상=에이아이파크)

“음성 AI 기술을 활용해 보이스 피싱 같은 범죄에 악용할 수도 있겠죠. 하지만 AI 음성 중간에 특정 신호가 발생하도록 하는 식으로 예방할 수 있다고 봅니다. 얼굴 영상 같은 경우는 이미 꽤 악용된 사례가 적지 않은 것으로 아는데, 저희도 딥페이크 검출 기술 등을 연구한 바 있어요. 하지만 검출은 예방과는 다른 차원이죠. 굳이 예방하기 위해서라면 사람이 감지할 수 있는 고주파를 넣거나 가짜 영상임을 알 수 있도록 어색함을 인위적으로 넣는 것도 생각해 볼 수 있어요. 물론 이는 또 품질 문제와 연결되는 부분이라 사회적 합의가 필요하다고 봐요. 제가 생각하는 또 다른 방식은 애초에 특정 음성, 영상 데이터로 범죄를 저지를 수 없도록 블록체인 기술과 같이 기록이 남는 방식을 적용하는 거죠. 어떤 기업의 서비스를 이용할 시에는 로그 기록이 블록체인 방식으로 다 남아 위변조가 불가능하게 하면 예방할 수 있지 않을까 싶어요.”

궁극적인 목표는 ‘인공지능을 통한 미디어 사업의 기술 혁신’

에이아이파크는 현재에 안주하지 않고 지속적으로 AI 아바타 기술 고도화에 총력을 기울이고 있다. 그렇다면 기술 고도화를 통해 에이아이파크가 지향하는 궁극적인 목표는 무엇일까. 박 대표는 “처음 에이아이파크를 설립할 때부터 ‘사람과 함께하는 인공지능’을 비전으로 삼았다”며 “현재의 방향성은 AI를 활용한 미디어 사업의 기술 혁신”이라고 설명하며 말을 이어갔다.

“언뜻 방송 출연자를 AI 아바타로 대체한다는 의미처럼 들리기도 하지만, 제가 생각하는 부분은 굳이 기계적인 일을 하지 않아도 되는, 단순한 업무에서 해방되는 기술 개발이예요. 저도 앵커를 하지만 중요한 의미를 전달해야 하는 순간이 있는가 하면 기계적으로 특정 메시지만을 전달만 하는 업무도 있거든요. 그런 부분에서 인공지능을 활용하자는 것이 저희 목표예요. 인간만이 할 수 있는 창의적인 일에 더 시간을 쓴다면 미디어 분야도 좀 더 다른 차원의 발전을 기대해 볼 수 있지 않을까 생각해요. 인공지능 기술이 영상 제작 등에 도입된다면 불필요한 시간과 자원의 낭비를 줄일 수 있다고 봅니다.”

박 대표의 향후 목표는 에이아이파크의 인공지능 기술을 지속적으로 고도화해 고효율의 AI 아바타를 만들어 내는 것이다. 고효율의 AI 아바타가 완성된다면 앞서 언급한 AI 아바타를 활용한 매지니먼트 사업, 미디어 사업 등도 보다 구체화 될 것이다. 그때가 된다면 10년차 뉴스 앵커의 창업 이야기는 ‘뉴스 앵커 출신의 스타트업 대표가 이룬 인공지능 미디어 사업의 혁신’ 스토리가 될 수도 있지 않을까?

윤소영 기자

ericahue@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

서울대생들이 만든 소셜 스타트업, ‘시공간’ “LLM 활용, 대화형 챗봇으로 시각장애인의 온라인 쇼핑을 돕는 서비스 만들었습니다”

시공간이 개발·출시한 서비스는 총 세 가지다. 우선 대표 서비스인 ‘픽포미’를 들 수 있다. 이는 시각장애인을 위한 쇼핑 서비스로 다양한 상품 정보를 LLM(거대언어모델) 기반 AI로 요약해 시각장애인들에게 제공하는 것이 특징이다. 또 ‘브로디’는 시각장애인을 위한 사진 해설 서비스로, ‘글공방’은 자체적으로 시각장애인을 위한 대체텍스트 제작이 어려운 기업들을 위한 ‘대체텍스트 제작’ B2B 서비스로 고도화를 진행 중이다.

AI의 파괴적 혁신···2D 레이더 지도를 몇분만에 3D지도로

최근 전세계적으로 지진 발생 소속이 부쩍 잦아진 것 같다. 요 근래만 해도 일본 근해의 지진이 있고 뉴욕지진, 대만 지진이 세계를 놀라게 했다. 이런 지진이 발생했을 때 도시지역이라면 재난 발생지역을 입체적으로 보여주는 3D지도가 긴요해진다. 때마침 IEEE스펙트럼은 독일 뮌헨 분데스베어대학교가 이런 지도 제작을 단 몇 분 만에 만들어줄 인공지능(AI) 모델을 개발했다.

아이폰 판매량은 급감하고 삼성 이익은 900% 증가하는 이유

스마트폰 시장에서 중국소비자가 자국 브랜드로 눈을 돌리고, 삼성전자의 글로벌 시장 1위 왕좌 탈환으로 애플의 아이폰 판매량이 급감하고 있다. 미국 정부의 중국에 대한 외국 칩 기술 접근을 제한 노력에도 불구하고 화웨이는 놀라운 성능의 메이트60를 공개하면서 충격을 안기기도 했다. 삼성은 이미 AI에 올인하고 이를 스마트폰을 통해 적극적으로 선보이는 가운데, 애플은 아직까지도 AI에 대한 강력한 메시지를 전달하지 않고 있다는 지적이 나온다.

김계관 그리드원 대표 “생성형 AI에 OCR, RPA로 눈과 손 달아, 사람처럼 직접 행동하는 AI 에이전트를 소개합니다”

LLM 기반 생성형 AI에  OCR, RPA 역량 더하니… 스스로 사람처럼 작업 수행하는 ‘AI 에이전트’ 됐다 API 없이 모든 앱 직접...