뉴욕타임즈 vs 오픈AI 소송의 의미

세계적인 유명 언론사 뉴욕타임스가 오픈AI(ChatGPT)를 저작권 침해 혐의로 고소했습니다. 자신들의 기사를 무단으로 사용하고 있다는 주장인데요. 이 소송의 결말이 어떻게 나오느냐 하는 것은 앞으로 인공지능의 발전에 상당한 파장을 줄 것으로 생각됩니다. NYT와 같은 언론사 입장에서는 챗GPT로 대표되는 AI 챗봇이 자신들의 인터넷 트래픽을 빼앗아 광고 수익에 타격을 주게 될 것을 우려하여, 자신들의 지식재산에 기반해 AI 챗봇이 만들었졌다는 주장을 하고 있습니다. 언론사가 챗GPT를 상대로 소송을 제기한 건 너희들이 학습을 하는데 우리 데이터를 무단으로 가져다가 지금의 인공지능 모델을 만들어 낸 거니까 우리한테 보상을 해라라는 개념입니다. 

챗GPT 입장에서는 만약에 뉴욕 타임즈 얘기를 그냥 오케이하고 들어주면 뉴욕타임스뿐 아니라 전 세계 모든 언론사에 다 돈을 줘야 되는 상황이 되는 겁니다. 그래서 챗GPT를 만든 오픈AI는 공개적으로 이용할 수 있는 인터넷 상의 자료를 사용해 인공지능을 학습시키는 것은 ‘공정 이용’이라고 주장하고 있습니다. ‘공정이용’은 저작권자의 허가를 얻지 않고도 저작물을 제한적으로 이용할 수 있도록 허용하는 법적 개념인데요. 미국의 주요 판례가 그동안 인공지능 학습을 위해  인터넷 공간에 있는 저작물을 사용하는 것을 허용하는 의견을 내고 있습니다. 게다가 몇몇 유명 언론사들이 오픈AI와 뉴스 기사 사용에 대해 합의하기도 했습니다. 이런 상황을 종합해 볼 때, 뉴욕타임즈가 소송에서  유리한 환경은 아닌데요. 어쨌든 재판의 승패와 상관없이 이 세기의 소송은 상당히 중요한 이슈를 던지고 있습니다.

챗GPT와 같은 생성형 인공지능 모델들은 수많은 언어를 학습해서 지금의 엄청난 능력을 갖게 된 건데요. 이런 언어 학습을 위해서는 엄청난 규모의 데이터를 필요로 합니다. 그리고 얼마나 좋은 데이터를 가지고 학습을 하느냐에 따라서 보다 더 효율적인 인공지능이 만들어진다고 하기 때문에 전문가들이 인공지능 얘기를 할 때는 언제나 데이터의 중요성에 대해 얘기를 합니다. 전 세계 인터넷 데이터를 거의 독점하고 있는 구글, 페이스북 같은 빅테크 기업들이 미래 인공지능 시대에 선도적인 회사가 될 수 밖에 없는 이유도 엄청난 양의 데이터를 보유하고 있기 때문이라는 것이죠. 오픈AI 역시 챗GPT를 만들어내기 위해서는 엄청난 양의 데이터가 필요했는데, 자체 서비스를 가지고 있지 않기때문에 인터넷에 올려져 있는 데이터들을 사용한 것입니다.

그런데 바로 이점이 인공지능 시대에 데이터를 가지고 있는 콘텐츠 기업들이 인공지능 기술을 독점하고 있는 빅테크 기업과 동등한 관계를 만들어낼 수 있는 포인트라고 생각합니다. 콘텐츠 기업들이 가지고 있는 데이터의 값어치에 대해 깊은 논의가 필요한 시기가 된 것이죠. 인공지능을 학습시키는 것에 효율적인 자료로 활용이 될  수 있기 때문에 인공지능에서 벌어들이는 돈의 일정 부분을 보상으로 가져가야 된다라고 하는 논리를 구체적으로 다듬어야할 필요가 있습니다. 챗GPT가 인터넷 데이터를 가져다가 학습을 했다고 하는데, 그렇다면 뉴욕타임즈의 기자가 쓴 기사도 있겠지만 일반 사람들이 블로그에 올린 글이라든지 유튜브에 올린 영상 등 일반 유저들이 올린 데이터들이 상당 부분 사용되어졌다고 할 수 있을 것 입니다. 이렇게 다양한 저작자들의 데이터를 사용하고 있다면 인공지능이 앞으로 벌어드릴 돈을 어떻게 창작자들에게 나눠줄 수 있을까를 깊게 고민해 봐야 되는 시간입니다. 

인공지능 시대, 인공지능이 점차 사람이 하는 일을 대체하게 되면서 인간의 노동력이 위기에 빠질 것이라는 우려는 이제 현실이 되어가고 있습니다. 인공지능이 새로운 일자리를 만들거라고 하지만 다른 일자리로 옮겨가기 위해서는 교육이 필요하기에 일정 시간동안은 결국 직업을 잃을 수 밖에 없습니다. 이런 전환 과정에 엄청난 규모의 자금이 필요하다는 것이 대부분 전문가들의 공통된 의견입니다. 그래서 인공지능으로 돈을 버는 기업이나 사람들에게 세금을 걷어 이런 사회의 혼란을 일정 정도 상쇄시키는 방안을 만들어 보자라고 해서 나온 아이디어가 바로 ‘인공지능 세금(AI TAX)’입니다. 그 세금을 가지고 일반 사람들에게 기본소득이라고 해서 일정 정도의 금액을 나눠주는 것이 인류의 미래를 위해 필요하다는 의견인 것이죠.

일부에서는 이런 기본소득을 노동 의욕을 저해하는 공짜 돈이라 반대하기도 합니다. 인간이 일을 한다는 것은 단순히 돈을 버는 목적을 넘어서 자신의 꿈을 실현하는 도구가 되어야 한다고 생각하는 것이죠. 맞습니다. 우리는 그저 공짜 돈을 가지고 소비만을 위해 세상을 살고 싶지는 않습니다. 그런데 인공지능 세금으로 우리가 돈을 받는다고해도 그건 공짜 돈이 아닙니다. 우리는 영상을 유튜브에 올리고, 글을 블로그에 쓰고, 인스타에 사진을 올리는 창작 활동을 하고 있습니다. 이런 행동을 우리가 함으로써 인간이 만들어낸 데이터를 가지고 인공지능이 학습을 하는 것입니다. 이런 학습을 통해 만들어진 인공지능이 수익을 창출한다면 그것에 기여한 우리 모두는 인공지능의 학습 자료를 제공하고 있는 저작권자입니다. 모든 사람이 콘텐츠를 만들어내고 있다는 전제로 기본소득이라고 하는 것을 받을 자격이 충분히 있다는 것이죠.  뉴욕타임즈는 자신들의 기사를 챗GPT가 가져가서 학습하는데 활용했다 라는 주장을 하고 있지만, 이 논리를 좀 더 확장해서 우리 모두가 인터넷 서비스에 콘텐츠를 생산해내고 있는 창작 주체라는 생각을 정교화할 필요가 있습니다. 인공지능 시대, 우리는 인공지능을 학습시킬 데이터를 만들어내는 창작 주체로 자리매김 되어야 합니다.


본 기사의 원문은 여기서 볼 수 있습니다.

고찬수PD

tech42@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

이제는 AGI를 준비해야 할 시기

이제는 생성형 인공지능을 뛰어넘는 범용 인공지능을 언급하는 시대가 도래하고 있어요. 여러 분야에 두루 쓰이는 인공지능이라면 인공지능을 필요로 하는 기업들의 까다로운 입맛에 잘 맞춰줄 수 있지 않을까요?

쿠팡은 와우 멤버십 가격을 왜 올린 걸까요?

작년 연말 기준으로 쿠팡 와우 멤버십 회원 수는 약 1,400만 명으로 알려져 있습니다. 2021년 말 무려 70%나 와우 멤버십 가격을 올렸을 때도, 회원 수가 줄기는커녕 더욱 늘어났는데요. 다만 이제는 현재 수준의 혜택으로 이 이상 멤버십 회원 수를 키우는 건 어렵다고 판단한 것이 아닐까 싶습니다. 그래서 결국 수익 확대의 길을 택하게 된 것일 거고요.

형편없는 글 솜씨 때문에 직장생활이 힘겹다면?

비즈니스 글쓰기는 다릅니다. 기본적인 3가지 원칙을 지켜 반복 훈련하면 글 솜씨를 훨씬 발전시킬 수 있는데요. 그럼 상사 속 터지게 만드는 대표적인 비즈니스 글 3가지 유형을 살펴보고, 이런 글을 쓰지 않기 위해 명심해야 할 세 가지 원칙을 확인해볼까요?

티빙은 왜 한국프로야구 온라인 중계권을 샀을까?

왜 티빙은 3년 계약에 1,300억이 넘는 큰 금액을 투자해서 이 권리를 구매했을까요? 3년에 1,300억은 1년에 400억이 훨씬 넘는 금액을 투자한 것인데 그만큼의 가치가 있는걸까요? 기존에 온라인 중계권을 가지고 있던 네이버와 통신사 등의 컨소시엄보다 더 큰 금액을 투자해서 티빙은 무엇을 얻고자 하는걸까요?