금도끼 은도끼 이야기를 아시나요?

[매거진 : 인간 세상에 스며든 인공지능]

생성형 인공지능이 만들어낸 결과물, 진짜와 가짜를 구분해야 하는 이유

어느 날 나무꾼 하나가 숲에 들어가 평소처럼 나무를 베고 있었습니다.   
"해가 떨어지기 전에 얼른 마쳐야겠다. 서두르자"
열심히 도끼질을 하던 중, 손에서 미끄러진 도끼가 그만 강물에 빠지게 되었습니다.
나무에서 내려와 어쩔 줄 모르던 나무꾼 앞으로 누군가가 나타났습니다. 주변이 황금빛으로 물들어 눈이 부실 정도였습니다. 금도끼를 들고 나타난 산신령이었습니다. 
"이 금도끼가 니 도끼냐?"
"금도끼는 제 것이 아닙니다"
그러자 은도끼를 꺼내 들며 "그럼 이 은도끼가 니 도끼냐?"
하지만 나무꾼은 은도끼도 자기 것이 아니라고 말합니다. 그리고 이번에는 나무꾼의 진짜 쇠도끼를 꺼내 들고 나타납니다. 
"그렇다면 이 낡은 쇠도끼가 네 것이냐?" 
"네, 그것이 바로 제 도끼입니다"
금도끼도 은도끼도 자기 것이 아니라면서 낡아빠진 쇠도끼를 자기 것이라고 답한 나무꾼의 정직함과 성실함을 가상히 여겨 금도끼 그리고 은도끼를 모두 건네주었답니다. 그렇게 마을로 내려간 후 며칠 뒤 친구에게 자신이 겪었던 이야기를 해주게 되었습니다. 평소 욕심 많았던 친구는 똑같은 장소에서 쇠도끼를 던져 우는 척을 했습니다. 그러자 똑같은 현상이 일어나게 됩니다. 
"이 금도끼가 니 도끼냐?"
이 친구는 별다른 고민도 없이 이렇게 답을 했습니다. 
"네, 바로 그게 제 것입니다"
산신령의 온화한 표정은 순식간에 어두워졌습니다. 그리곤 버럭 화를 냈습니다. 
"못된 것, 어디서 거짓말이냐?"
화가 난 산신령이 물보라를 일으키며 친구를 덮쳤습니다. 이제는 우는 척이 아니라 너무 무서워 살려달라며 진짜로 울부짖고 있네요. 그리곤 정신을 잃고 쓰러지게 되었답니다. 그날 저녁이 되어서야 겨우 살아난 친구는 자신의 도끼도 잃고 물에 흠뻑 젖은 채로 울면서 마을로 내려왔답니다. 그래도 목숨은 건졌네요. 

<금도끼 은도끼>는 이솝우화의 <나무꾼과 헤르메스>(The Honest Woodman)라는 이야기를 원작으로 합니다. 그러니까 원작을 바탕으로 조금 각색된 형태의 이야기라는 거죠. 헤르메스 대신 산신령이 등장한다는 것부터 조금 다르죠. 언급된 것처럼 원작에는 헤르메스가 등장합니다. 그렇다고 산신령이 등장하는 <금도끼 은도끼>의 이야기가 터무니없는 '가짜'이거나 '위작'이라고 할 순 없습니다. 여기서 말하는 '위작'은 거짓 작품이라는 뜻인데요. 어떤 예술 작품을 위조해서 만드는 것을 말합니다. 레오나르도 다빈치의 <모나리자>를 그대로 베껴서 그리면 '모작'이 됩니다. 그런데 그렇게 그림을 그려놓고는 "이건 제가 창조해 낸 그림입니다"라면서 대중을 속이고 돈을 목적으로 판매하게 되면 사기꾼이 되는 것이죠. 기본적으로 모작이라고 한다면 원본의 출처는 기본적으로 표기하고 밝혀야 하는 것입니다. 

"금도끼가 니 도끼냐? - <금도끼 은도끼> 중에서.  출처 : 예림 TV 유튜브

생성형 인공지능, 진짜와 가짜 

세계경제포럼의 클라우스 슈밥 의장은 몇 년 전 '4차 산업혁명'과 '초연결사회'를 언급한 적이 있습니다. 그 후 몇 년이 흐른 지금 챗GPT의 등장을 경험하고 목격하며 이것은 단지 시작에 불과하다고 말합니다. 그리고는 '인공지능 황금시대의 도래'를 이야기하기도 했습니다. 챗GPT가 가진 잠재력이야말로 '금도끼' 이상의 가치가 있다는 것이죠. 쇠도끼를 쥐고 있는 지금의 챗GPT 유저들은 생성형 인공지능을 통해 금이라도 캐려는 듯 다양한 것들을 쿼리로 던집니다. 그리고 결과물을 바탕으로 무엇인가 만들어내고 합니다. 인터넷이 생기고 검색 엔진이 발달하면서 자료 검색이라던가 번역, 엄청난 양의 데이터나 자료를 분석하는 지극히 단순하고 번거로운 작업들을 단숨에 해결하기도 했습니다. 생성형 인공지능이 탄생하면서 그 시간은 더욱 단축되었습니다. 대놓고 결과물을 만들어주고 있으니까요. 소설이나 에세이 등 특정 분야는 물론이고 리포트라던가 뉴스 기사와 같이 사용자가 특정한 아이템을 던져주면 장르를 막론하고 결과물을 써주기도 합니다. 이미지도 마찬가지죠. 미드저니로 만들어진 캐릭터는 마치 살아있는 듯 정교했는데요. 캐릭터에 대한 머릿속 상상을 눈으로 보이는 결과물로 만들어주기에 충분했습니다. 사람은 결괏값을 받아 다듬기만 하면 됩니다. 혹자는 생성형 인공지능이 뱉어낸 이야기나 이미지를 마치 자신이 만들어낸 것인 듯 콘텐츠에 이름을 슬쩍 붙이기도 합니다. 

생성형 인공지능이 집어삼킨 데이터가 그만큼 방대하기 때문에 보다 정교한 결과물을 낼 수 있습니다. 챗GPT 시대가 도래하면서 진짜와 가짜를 구분하기가 매우 어려워졌습니다. <금도끼 은도끼>에 나온 나무꾼의 진짜 도끼는 쇠도끼입니다. 인공지능 시대를 맞이한 지금, 우리가 손에 쥔 도끼의 색깔은 무엇입니까? 

라파엘로의 <아테네 학당>(The School of Athens)  출처 : JOY OF MUSEUMS VIRTUAL TOURS

20세기 미술의 거장이라고 불리는 피카소는 "좋은 예술가는 베끼고 훌륭한 예술가는 훔친다"라고 했고 노벨문학상을 거머쥔 바 있는 영국 시인 T.S 엘리엇(토마스 스턴스 엘리엇)도 "어설픈 시인은 모방하고 원숙한 시인은 훔친다"라면서 비슷한 이야기를 하기도 했답니다. 이탈리아 전성기 르네상스의 가장 중요한 인물이자 위대한 화가로 인정받는 라파엘로도 미켈란젤로와 레오나르도 다빈치의 그림을 모사하면서 자신만의 화풍을 만들어냈고 급기야 교황청에 그린 프레스코(fresco)화로 크게 성공하기도 했습니다. 라파엘로의 대표 작품이라면 <아테네 학당>을 손꼽을 수 있겠네요. 그저 베끼는 것만으로는 좋은 결과를 낼 수 없습니다. 기존의 것을 어떻게 습득하고 새로운 가치를 만들어내느냐에 따라 결과는 분명 달라집니다. 

생성형 인공지능이 만들어내는 결과물은 방대한 데이터를 바탕으로 연산하고 모방한 결과물을 내놓습니다. 그러면서도 세상에 없던 이야기를 창조해 냈다고 말합니다. 어디서 많이 본 듯 하지만 어디에서도 찾을 수 없는 이야기라는 것이죠. 이미지의 경우는 어떨까요? 인공지능이 만들어내는 극사실적인 이미지와 영상, 음성 모두 그 형태에 관계없이 우후죽순 만들어져 널리 퍼지고 있는 실정입니다. 차라리 SNS가 없었다면 그나마 나았을까요?

 

"트럼프가 체포되고 있습니다"  by Eliot Higgins using Midjourney v5

"어제 트럼프가 경찰한테 잡혔다며?"

도널드 트럼프가 경찰들에 쫓기거나 체포되는 장면이 화제가 되었던 적이 있습니다. 그러나 이건 가짜로 밝혀졌습니다. 해외 매체들도 'AI-Faked Image'라는 타이틀을 붙여 트럼프의 다급한 모습이 담긴 이미지와 함께 기사화하기도 했습니다. 이미지만 얼핏 본다면 "트럼프가 체포되는 순간"으로 착각할 수도 있을 것 같네요. 이 사진은 엘리엇 히긴스(Eliot Higgins)라는 크리에이티브 디렉터이자 벨링캣이라는 탐사미디어의 창립자가 미드저니로 만들어낸 페이크 이미지랍니다. 페이크이지만 굉장히 사실적이죠. 그리고 SNS를 통해 순식간에 퍼져나가 수백만 명이 이를 퍼 나르기도 했습니다. 세계 어느 곳에 가든 '정치'라는 것은 존재합니다. 각각의 이데올로기가 존재하고 있으니 선거에서도 흑색선전이 난무하죠. 이러한 가짜 이미지가 자칫 선거에 악영향을 끼칠 수 있다고 말합니다. 생성형 인공지능의 정치적 편향성을 걱정해야 할지도 모른다는 것이죠. 그만큼 진짜인지 가짜인지 모를 정도로 굉장히 설득력 있는 이미지를 만들어 낼 뿐 아니라 정교하답니다. 

트럼프 사례를 들기도 했지만 딥페이크 어뷰징에 대한 문제는 반드시 짚어봐야 할 이슈랍니다. 때문에 생성형 인공지능 개발사들도 정치적이거나 선정적이고 자극적이며 폭력적인 것들에 대한 이미지는 걸러내려는 등 엄격한 규칙을 적용하고 있는 중입니다. 그럼에도 불구하고 어뷰징이라는 것은 그 규칙을 우회하면서 발생하기도 하는데요. 얼마나 잘 지켜질 수 있을까요?  

체포되는 트럼프와 화이트 패딩을 입고 있는 교황, 모두 페이크입니다.  출처 : X

쏟아지는 생성 AI의 결과물! 

가끔 구글링을 하다 보면 방대한 결과물에 놀라기도 합니다. 'BTS'라는 키워드를 입력했더니 무려 21억 개나 되는 결과물이 나오기도 했습니다(물론 그 결과물의 수량은 달라질 수 있습니다) BTS에 속한 각각의 멤버들 프로필과 관련 뉴스부터 음반, 뮤직비디오, SNS, 사진 등 형태도 다양했습니다. 구글에서 검색한 BTS 키워드는 하나의 사례로 언급한 것이지만 생성형 인공지능이 만들어내는 이미지 수는 상상을 초월하는 수준입니다.

AI가 만들어낸 이미지의 개수, 보이시나요?  출처 : Everypixel Journal

"AI Has Already Created As Many Images As Photographers Have Taken in 150 Years. Statistics for 2023"

생성형 인공지능이 만들어낸 이미지는 사진가들이 무려 150년간 찍어내는 결과물의 수량과 맞먹는다고 합니다. 인류 최초의 사진 헬리오그래피가 등장한 1826년부터 1975년까지 150년 동안 쌓아 올린 사진들 그리고 미드저니 등 생성형 인공지능을 통해 만들어낸 이미지의 개수는 각각 150억 장 수준이라고 합니다. DALL-E2는 2022년 4월, 미드저니는 2022년 7월에 서비스를 시작했습니다. 지금 이 순간에도 세상에 없던 이미지들이 계속해서 만들어지고 있다는 뜻입니다. 나아가 이러한 이미지가 진짜 사진들 속에 켜켜이 쌓여 진짜 사진을 찾지도 못하고 구분하지도 못할 정도로 난립하게 된다는 의미가 되죠.  

생성형 인공지능이 만들어낸 이미지라는 걸 표현할 수 있다면 어떨까요? 구글은 이미지 검색 결과를 신뢰할 수 있도록 출처 표기는 물론 AI를 통해 만들어진 이미지도 구별 가능하도록 업데이트했다고 합니다. 그런데 말입니다. AI가 만들어낸 사진을 구분한다고 한들 지금까지 수북하게 쌓인 이미지 결과물들이 내일이 되면 또다시 쏟아져 어딘가에 쌓이게 될 텐데 무슨 의미가 있을까요? 강물이 범람해 댐을 개방하려고 수문을 열면 어딘가에서는 홍수가 일어날 수도 있습니다. 지금 우리는 물난리를 겪고 있는 셈이죠. 

생성형 인공지능이 만들어낸 이미지를 제대로 구분하기 위해 워터마크를 활용한다는 아이디어도 있었습니다. 보통의 워터마크는 이미지 한쪽에 표기하곤 합니다. 언론사들 역시 이렇게 많이 씁니다. 하지만 이미지 내용을 일부 가릴 수 있습니다. 이미지에 프레임을 씌우고 바깥쪽에 출처를 표기하는 경우도 있을 테지만 원하는 부분만큼 이미지를 도려내는 '크롭' 사례도 있습니다. 그렇다면 이미지 파일이 가진 메타 데이터에 워터마크를 부여한다면 어떨까요? 하지만 이 역시도 특정 프로그램을 통해 초기화할 수도 있어서 제대로 효과를 볼 수 있을지 미지수라고 합니다. 

9월 14일 정식 서비스를 알린 어도비 파이어플라이의 생성 이미지. 출처 : Adobe Firefly 

최근에 어도비의 파이어플라이가 정식 서비스가 되었습니다. 미드저니를 통한 유료 상품도 존재합니다. 물론 챗GPT도 유료 버전이 있습니다. 뤼튼(wrtn)과 같은 회사도 다른 기관이나 기업들과 협업을 모색하고 있는 중입니다. 인공지능 기반의 비즈니스 모델을 제대로 갖추려면 진짜와 가짜를 구분할 수 있는 해법이 선행되어야 하지 않을까요? 기존의 쇠도끼는 저 멀리 던져버리고 정작 내 것이 아닌 금도끼와 은도끼만 바라다보면 물에 빠진 생쥐꼴이 될 수 있습니다. 

당신이 상상하는 이미지를 머릿속으로 그리고 이를 텍스트로 만들어 생성형 인공지능에 넣기만 하면 무엇이든 만들어낼 수 있는 시대가 되었습니다. 프롬프트 입력 하나만으로도 결과물을 손에 넣을 수 있는 것이니 충분히 매력적이지 않은가요? 재미삼아 하는 경우도 있고 이를 통해 2차 저작물을 만들어내기도 합니다. 텍스트도 그러하지만 이미지를 만들어내는 생성형 인공지능을 통한 비즈니스도 확장되는 추세입니다. 이러한 기술 발전에는 우려의 목소리가 반드시 존재하곤 하죠. 혹자는 생성형 인공지능을 두고 '머리가 여러 개 달린 괴물'이라고 합니다. 그렇다면 이를 무찌를 수 있는 전사도 필요하지 않을까요? 실제로 'AI레드팀'이라는 존재가 있습니다. 생성형 AI가 가진 기술적 취약점은 물론이고 AI의 보안 이슈나 윤리적인 문제, 유해한 결과물에 대한 모니터링과 필터링, AI 어뷰징과 같은 이슈 등 샘성형 인공지능이 가질 수 있는 부작용을 굉장히 광범위하게 바라보고 고민하고 연구하는 조직입니다. 이 정도면 머리가 여러 개 달린 괴물 앞에 나타난 전사라고 할 수 있겠네요. 금도끼와 은도끼를 쫓는 사업적 확장보다 테크놀로지가 올바르게 자리 잡을 수 있도록 제도적인 절차를 마련해야 할 것이고 생성형 인공지능을 연구하고 개발하는 빅테크 또한 지속적으로 개선에 대한 고민을 해야 할 것입니다.  


본 기사의 원문은 여기서 볼 수 있습니다.

pen잡은루이스

tech42@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

구글뉴스에 언론사의 매체 등록이 어려워지다…신생 언론사 혼란 예상

이제는 구글 뉴스 정책이 1단계와 2단계를 수동 신청에서 자동으로 변경했기 때문에 과거 언론사들이 힘들어하던 3단계의 답답함이 더욱 심화될 것으로 보입니다. 이제는 구글에 매체 등록 승인 신청을 할 수 없기 때문에 내 매체가 구글 뉴스에 매체 등록된 것조차도 확인하기 어려워지기 때문입니다.

가볍게 훑어보는 엔비디아 히스토리 ①리바TNT부터 지포스256까지 GPU의 시작

요즘 가장 뜨거운 기업은 엔비디아죠. 엔비디아는 왜 유명해졌고, 어떻게 성장해 왔는지, 또 지금 왜 가장 주목받는 기업이 되었는지 이야기를 풀어봅니다.

바쁘다 바빠 현대사회! 끝내지 못한 일때문에 괴롭다면?

끝내지 못한 일이 이들을 심리적으로 긴장하게 하고, 그 일에 미련을 갖게 해 더 오래 기억한 건데요. 이걸 자이가르닉 효과라고 합니다.

이제는 AGI를 준비해야 할 시기

이제는 생성형 인공지능을 뛰어넘는 범용 인공지능을 언급하는 시대가 도래하고 있어요. 여러 분야에 두루 쓰이는 인공지능이라면 인공지능을 필요로 하는 기업들의 까다로운 입맛에 잘 맞춰줄 수 있지 않을까요?