금도끼 은도끼 이야기를 아시나요?

[매거진 : 인간 세상에 스며든 인공지능]

생성형 인공지능이 만들어낸 결과물, 진짜와 가짜를 구분해야 하는 이유

어느 날 나무꾼 하나가 숲에 들어가 평소처럼 나무를 베고 있었습니다.   
"해가 떨어지기 전에 얼른 마쳐야겠다. 서두르자"
열심히 도끼질을 하던 중, 손에서 미끄러진 도끼가 그만 강물에 빠지게 되었습니다.
나무에서 내려와 어쩔 줄 모르던 나무꾼 앞으로 누군가가 나타났습니다. 주변이 황금빛으로 물들어 눈이 부실 정도였습니다. 금도끼를 들고 나타난 산신령이었습니다. 
"이 금도끼가 니 도끼냐?"
"금도끼는 제 것이 아닙니다"
그러자 은도끼를 꺼내 들며 "그럼 이 은도끼가 니 도끼냐?"
하지만 나무꾼은 은도끼도 자기 것이 아니라고 말합니다. 그리고 이번에는 나무꾼의 진짜 쇠도끼를 꺼내 들고 나타납니다. 
"그렇다면 이 낡은 쇠도끼가 네 것이냐?" 
"네, 그것이 바로 제 도끼입니다"
금도끼도 은도끼도 자기 것이 아니라면서 낡아빠진 쇠도끼를 자기 것이라고 답한 나무꾼의 정직함과 성실함을 가상히 여겨 금도끼 그리고 은도끼를 모두 건네주었답니다. 그렇게 마을로 내려간 후 며칠 뒤 친구에게 자신이 겪었던 이야기를 해주게 되었습니다. 평소 욕심 많았던 친구는 똑같은 장소에서 쇠도끼를 던져 우는 척을 했습니다. 그러자 똑같은 현상이 일어나게 됩니다. 
"이 금도끼가 니 도끼냐?"
이 친구는 별다른 고민도 없이 이렇게 답을 했습니다. 
"네, 바로 그게 제 것입니다"
산신령의 온화한 표정은 순식간에 어두워졌습니다. 그리곤 버럭 화를 냈습니다. 
"못된 것, 어디서 거짓말이냐?"
화가 난 산신령이 물보라를 일으키며 친구를 덮쳤습니다. 이제는 우는 척이 아니라 너무 무서워 살려달라며 진짜로 울부짖고 있네요. 그리곤 정신을 잃고 쓰러지게 되었답니다. 그날 저녁이 되어서야 겨우 살아난 친구는 자신의 도끼도 잃고 물에 흠뻑 젖은 채로 울면서 마을로 내려왔답니다. 그래도 목숨은 건졌네요. 

<금도끼 은도끼>는 이솝우화의 <나무꾼과 헤르메스>(The Honest Woodman)라는 이야기를 원작으로 합니다. 그러니까 원작을 바탕으로 조금 각색된 형태의 이야기라는 거죠. 헤르메스 대신 산신령이 등장한다는 것부터 조금 다르죠. 언급된 것처럼 원작에는 헤르메스가 등장합니다. 그렇다고 산신령이 등장하는 <금도끼 은도끼>의 이야기가 터무니없는 '가짜'이거나 '위작'이라고 할 순 없습니다. 여기서 말하는 '위작'은 거짓 작품이라는 뜻인데요. 어떤 예술 작품을 위조해서 만드는 것을 말합니다. 레오나르도 다빈치의 <모나리자>를 그대로 베껴서 그리면 '모작'이 됩니다. 그런데 그렇게 그림을 그려놓고는 "이건 제가 창조해 낸 그림입니다"라면서 대중을 속이고 돈을 목적으로 판매하게 되면 사기꾼이 되는 것이죠. 기본적으로 모작이라고 한다면 원본의 출처는 기본적으로 표기하고 밝혀야 하는 것입니다. 

"금도끼가 니 도끼냐? - <금도끼 은도끼> 중에서.  출처 : 예림 TV 유튜브

생성형 인공지능, 진짜와 가짜 

세계경제포럼의 클라우스 슈밥 의장은 몇 년 전 '4차 산업혁명'과 '초연결사회'를 언급한 적이 있습니다. 그 후 몇 년이 흐른 지금 챗GPT의 등장을 경험하고 목격하며 이것은 단지 시작에 불과하다고 말합니다. 그리고는 '인공지능 황금시대의 도래'를 이야기하기도 했습니다. 챗GPT가 가진 잠재력이야말로 '금도끼' 이상의 가치가 있다는 것이죠. 쇠도끼를 쥐고 있는 지금의 챗GPT 유저들은 생성형 인공지능을 통해 금이라도 캐려는 듯 다양한 것들을 쿼리로 던집니다. 그리고 결과물을 바탕으로 무엇인가 만들어내고 합니다. 인터넷이 생기고 검색 엔진이 발달하면서 자료 검색이라던가 번역, 엄청난 양의 데이터나 자료를 분석하는 지극히 단순하고 번거로운 작업들을 단숨에 해결하기도 했습니다. 생성형 인공지능이 탄생하면서 그 시간은 더욱 단축되었습니다. 대놓고 결과물을 만들어주고 있으니까요. 소설이나 에세이 등 특정 분야는 물론이고 리포트라던가 뉴스 기사와 같이 사용자가 특정한 아이템을 던져주면 장르를 막론하고 결과물을 써주기도 합니다. 이미지도 마찬가지죠. 미드저니로 만들어진 캐릭터는 마치 살아있는 듯 정교했는데요. 캐릭터에 대한 머릿속 상상을 눈으로 보이는 결과물로 만들어주기에 충분했습니다. 사람은 결괏값을 받아 다듬기만 하면 됩니다. 혹자는 생성형 인공지능이 뱉어낸 이야기나 이미지를 마치 자신이 만들어낸 것인 듯 콘텐츠에 이름을 슬쩍 붙이기도 합니다. 

생성형 인공지능이 집어삼킨 데이터가 그만큼 방대하기 때문에 보다 정교한 결과물을 낼 수 있습니다. 챗GPT 시대가 도래하면서 진짜와 가짜를 구분하기가 매우 어려워졌습니다. <금도끼 은도끼>에 나온 나무꾼의 진짜 도끼는 쇠도끼입니다. 인공지능 시대를 맞이한 지금, 우리가 손에 쥔 도끼의 색깔은 무엇입니까? 

라파엘로의 <아테네 학당>(The School of Athens)  출처 : JOY OF MUSEUMS VIRTUAL TOURS

20세기 미술의 거장이라고 불리는 피카소는 "좋은 예술가는 베끼고 훌륭한 예술가는 훔친다"라고 했고 노벨문학상을 거머쥔 바 있는 영국 시인 T.S 엘리엇(토마스 스턴스 엘리엇)도 "어설픈 시인은 모방하고 원숙한 시인은 훔친다"라면서 비슷한 이야기를 하기도 했답니다. 이탈리아 전성기 르네상스의 가장 중요한 인물이자 위대한 화가로 인정받는 라파엘로도 미켈란젤로와 레오나르도 다빈치의 그림을 모사하면서 자신만의 화풍을 만들어냈고 급기야 교황청에 그린 프레스코(fresco)화로 크게 성공하기도 했습니다. 라파엘로의 대표 작품이라면 <아테네 학당>을 손꼽을 수 있겠네요. 그저 베끼는 것만으로는 좋은 결과를 낼 수 없습니다. 기존의 것을 어떻게 습득하고 새로운 가치를 만들어내느냐에 따라 결과는 분명 달라집니다. 

생성형 인공지능이 만들어내는 결과물은 방대한 데이터를 바탕으로 연산하고 모방한 결과물을 내놓습니다. 그러면서도 세상에 없던 이야기를 창조해 냈다고 말합니다. 어디서 많이 본 듯 하지만 어디에서도 찾을 수 없는 이야기라는 것이죠. 이미지의 경우는 어떨까요? 인공지능이 만들어내는 극사실적인 이미지와 영상, 음성 모두 그 형태에 관계없이 우후죽순 만들어져 널리 퍼지고 있는 실정입니다. 차라리 SNS가 없었다면 그나마 나았을까요?

 

"트럼프가 체포되고 있습니다"  by Eliot Higgins using Midjourney v5

"어제 트럼프가 경찰한테 잡혔다며?"

도널드 트럼프가 경찰들에 쫓기거나 체포되는 장면이 화제가 되었던 적이 있습니다. 그러나 이건 가짜로 밝혀졌습니다. 해외 매체들도 'AI-Faked Image'라는 타이틀을 붙여 트럼프의 다급한 모습이 담긴 이미지와 함께 기사화하기도 했습니다. 이미지만 얼핏 본다면 "트럼프가 체포되는 순간"으로 착각할 수도 있을 것 같네요. 이 사진은 엘리엇 히긴스(Eliot Higgins)라는 크리에이티브 디렉터이자 벨링캣이라는 탐사미디어의 창립자가 미드저니로 만들어낸 페이크 이미지랍니다. 페이크이지만 굉장히 사실적이죠. 그리고 SNS를 통해 순식간에 퍼져나가 수백만 명이 이를 퍼 나르기도 했습니다. 세계 어느 곳에 가든 '정치'라는 것은 존재합니다. 각각의 이데올로기가 존재하고 있으니 선거에서도 흑색선전이 난무하죠. 이러한 가짜 이미지가 자칫 선거에 악영향을 끼칠 수 있다고 말합니다. 생성형 인공지능의 정치적 편향성을 걱정해야 할지도 모른다는 것이죠. 그만큼 진짜인지 가짜인지 모를 정도로 굉장히 설득력 있는 이미지를 만들어 낼 뿐 아니라 정교하답니다. 

트럼프 사례를 들기도 했지만 딥페이크 어뷰징에 대한 문제는 반드시 짚어봐야 할 이슈랍니다. 때문에 생성형 인공지능 개발사들도 정치적이거나 선정적이고 자극적이며 폭력적인 것들에 대한 이미지는 걸러내려는 등 엄격한 규칙을 적용하고 있는 중입니다. 그럼에도 불구하고 어뷰징이라는 것은 그 규칙을 우회하면서 발생하기도 하는데요. 얼마나 잘 지켜질 수 있을까요?  

체포되는 트럼프와 화이트 패딩을 입고 있는 교황, 모두 페이크입니다.  출처 : X

쏟아지는 생성 AI의 결과물! 

가끔 구글링을 하다 보면 방대한 결과물에 놀라기도 합니다. 'BTS'라는 키워드를 입력했더니 무려 21억 개나 되는 결과물이 나오기도 했습니다(물론 그 결과물의 수량은 달라질 수 있습니다) BTS에 속한 각각의 멤버들 프로필과 관련 뉴스부터 음반, 뮤직비디오, SNS, 사진 등 형태도 다양했습니다. 구글에서 검색한 BTS 키워드는 하나의 사례로 언급한 것이지만 생성형 인공지능이 만들어내는 이미지 수는 상상을 초월하는 수준입니다.

AI가 만들어낸 이미지의 개수, 보이시나요?  출처 : Everypixel Journal

"AI Has Already Created As Many Images As Photographers Have Taken in 150 Years. Statistics for 2023"

생성형 인공지능이 만들어낸 이미지는 사진가들이 무려 150년간 찍어내는 결과물의 수량과 맞먹는다고 합니다. 인류 최초의 사진 헬리오그래피가 등장한 1826년부터 1975년까지 150년 동안 쌓아 올린 사진들 그리고 미드저니 등 생성형 인공지능을 통해 만들어낸 이미지의 개수는 각각 150억 장 수준이라고 합니다. DALL-E2는 2022년 4월, 미드저니는 2022년 7월에 서비스를 시작했습니다. 지금 이 순간에도 세상에 없던 이미지들이 계속해서 만들어지고 있다는 뜻입니다. 나아가 이러한 이미지가 진짜 사진들 속에 켜켜이 쌓여 진짜 사진을 찾지도 못하고 구분하지도 못할 정도로 난립하게 된다는 의미가 되죠.  

생성형 인공지능이 만들어낸 이미지라는 걸 표현할 수 있다면 어떨까요? 구글은 이미지 검색 결과를 신뢰할 수 있도록 출처 표기는 물론 AI를 통해 만들어진 이미지도 구별 가능하도록 업데이트했다고 합니다. 그런데 말입니다. AI가 만들어낸 사진을 구분한다고 한들 지금까지 수북하게 쌓인 이미지 결과물들이 내일이 되면 또다시 쏟아져 어딘가에 쌓이게 될 텐데 무슨 의미가 있을까요? 강물이 범람해 댐을 개방하려고 수문을 열면 어딘가에서는 홍수가 일어날 수도 있습니다. 지금 우리는 물난리를 겪고 있는 셈이죠. 

생성형 인공지능이 만들어낸 이미지를 제대로 구분하기 위해 워터마크를 활용한다는 아이디어도 있었습니다. 보통의 워터마크는 이미지 한쪽에 표기하곤 합니다. 언론사들 역시 이렇게 많이 씁니다. 하지만 이미지 내용을 일부 가릴 수 있습니다. 이미지에 프레임을 씌우고 바깥쪽에 출처를 표기하는 경우도 있을 테지만 원하는 부분만큼 이미지를 도려내는 '크롭' 사례도 있습니다. 그렇다면 이미지 파일이 가진 메타 데이터에 워터마크를 부여한다면 어떨까요? 하지만 이 역시도 특정 프로그램을 통해 초기화할 수도 있어서 제대로 효과를 볼 수 있을지 미지수라고 합니다. 

9월 14일 정식 서비스를 알린 어도비 파이어플라이의 생성 이미지. 출처 : Adobe Firefly 

최근에 어도비의 파이어플라이가 정식 서비스가 되었습니다. 미드저니를 통한 유료 상품도 존재합니다. 물론 챗GPT도 유료 버전이 있습니다. 뤼튼(wrtn)과 같은 회사도 다른 기관이나 기업들과 협업을 모색하고 있는 중입니다. 인공지능 기반의 비즈니스 모델을 제대로 갖추려면 진짜와 가짜를 구분할 수 있는 해법이 선행되어야 하지 않을까요? 기존의 쇠도끼는 저 멀리 던져버리고 정작 내 것이 아닌 금도끼와 은도끼만 바라다보면 물에 빠진 생쥐꼴이 될 수 있습니다. 

당신이 상상하는 이미지를 머릿속으로 그리고 이를 텍스트로 만들어 생성형 인공지능에 넣기만 하면 무엇이든 만들어낼 수 있는 시대가 되었습니다. 프롬프트 입력 하나만으로도 결과물을 손에 넣을 수 있는 것이니 충분히 매력적이지 않은가요? 재미삼아 하는 경우도 있고 이를 통해 2차 저작물을 만들어내기도 합니다. 텍스트도 그러하지만 이미지를 만들어내는 생성형 인공지능을 통한 비즈니스도 확장되는 추세입니다. 이러한 기술 발전에는 우려의 목소리가 반드시 존재하곤 하죠. 혹자는 생성형 인공지능을 두고 '머리가 여러 개 달린 괴물'이라고 합니다. 그렇다면 이를 무찌를 수 있는 전사도 필요하지 않을까요? 실제로 'AI레드팀'이라는 존재가 있습니다. 생성형 AI가 가진 기술적 취약점은 물론이고 AI의 보안 이슈나 윤리적인 문제, 유해한 결과물에 대한 모니터링과 필터링, AI 어뷰징과 같은 이슈 등 샘성형 인공지능이 가질 수 있는 부작용을 굉장히 광범위하게 바라보고 고민하고 연구하는 조직입니다. 이 정도면 머리가 여러 개 달린 괴물 앞에 나타난 전사라고 할 수 있겠네요. 금도끼와 은도끼를 쫓는 사업적 확장보다 테크놀로지가 올바르게 자리 잡을 수 있도록 제도적인 절차를 마련해야 할 것이고 생성형 인공지능을 연구하고 개발하는 빅테크 또한 지속적으로 개선에 대한 고민을 해야 할 것입니다.  


본 기사의 원문은 여기서 볼 수 있습니다.

pen잡은루이스

tech42@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

흘러가는 데이터를 시각화로 다시 본다면?

모든 흐름은 눈으로 볼 수 없고, 보기 어렵다는 것이 사실입니다. 만약 이 보이지 않는 흐름을 볼 수 있다면 어떨까요? 무언가 잊고 모르던 사실을 알아낼 수 있지 않을까요? 오늘은 우리가 쉽게 인지하지 못하고 있는 ‘보이지 않는 흐름을 시각화’한 사례에 대해서 알아보려고 합니다.

아트부산 2024, 한국 미술시장 도전과 과제

국내 미술시장에서 NFT의 흐름이 희미한 것과 상반된 모습을 보여주는 일본의 현대 미술가이자 팝아티스트인 무라카미 다카시가 떠올랐습니다. 그는 순수 미술과 상업 미술 양쪽 모두에서 작업하고 있습니다. 그는 팬데믹 시기에 NFT에서 돌파구를 찾은 뒤  트렌드를 의심하기보다 실험하며 꾸준히 NFT아트에 집중하고 있습니다. 

AI : Text to Video의 시대

문자 그대로 텍스트만 입력하면 이미지를 만들어내는 'Text to Image'라는 기술이 등장하게 된 것이죠. 하지만 이것도 철 지난 '옛날' 이야기입니다. 얼마 지나지 않았지만 이제는 'Text to Video'도 가능해졌으니까요. 

인간은 왜 기계와 융합을 꿈꾸는가

인간과 기계의 융합: 영원성을 인간의 욕심 인간은 수세기에 걸친 진화의 과정에서 항상 삶의 유한성과 존재의 무한성 사이의 균형을 찾으려는 욕망을...