당신이 20년간 정성스럽게 쓴 소설이 어느 날 거대 AI 기업의 학습 데이터로 쓰였다면, 그리고 그 기업이 "우리는 합법적으로 사용했습니다"라고 말한다면 어떤 기분이 들까. 지금 전 세계 창작자들이 겪고 있는 현실이 바로 이것이다. 인공지능은 이제 우리 삶 깊숙이 들어왔지만, 정작 그 기술이 학습한 데이터의 주인들은 자신들의 목소리조차 제대로 내지 못하고 있다.
2026년 3월 2일, 미국 대법원은 한 가지 분명한 선을 그었다. AI가 100% 독립적으로 만든 창작물은 저작권 보호를 받을 수 없다는 판결이었다. 컴퓨터 공학자 스티븐 탈러는 자신이 개발한 AI '다부스'가 생성한 비주얼 아트 작품에 대해 저작권 등록을 신청했지만, 법원은 "인간의 저작물이라는 점이 저작권법의 근간을 이루는 요건"이라며 이를 거부했다. 결국 AI는 저작자가 될 수 없다는 것이다.

■ 해적판 데이터로 키운 AI, 법원은 "변형적 이용"이라 했지만
하지만 AI가 학습 과정에서 저작물을 사용하는 것은 또 다른 문제다. 2025년 6월, 미국 북부 캘리포니아 연방법원의 윌리엄 알섭 판사는 AI 기업 앤트로픽이 합법적으로 구매한 도서를 스캔해 LLM 훈련에 사용한 것을 '공정 이용'으로 인정했다. 판사는 "LLM 훈련은 우리가 평생 보게 될 가장 변형적인 기술 중 하나"라고 평가하며, AI 모델이 원본 콘텐츠를 저장하는 것이 아니라 통계적 관계를 추출한다는 점을 강조했다.
그러나 같은 법원의 또 다른 판사는 다른 결론을 내렸다. 불과 이틀 뒤인 6월 25일, 빈스 차브리아 판사는 메타가 온라인 '그림자 도서관'에서 가져온 도서들로 라마 모델을 훈련시킨 사건에서 시장 피해 여부를 더 엄격히 검토해야 한다고 지적했다. 법원은 공정 이용을 인정하면서도 해적판 데이터 출처에 대해서는 책임이 있다고 판단했고, 결국 앤트로픽은 15억 달러 규모의 집단 소송 합의에 도달했다.
이처럼 법원마다 판결이 엇갈리는 이유는 명확하다. AI 학습이 원저작물을 '변형'했다고 보느냐, 아니면 단순히 '복제'했다고 보느냐의 관점 차이 때문이다. 로이터가 AI 스타트업 로스 인텔리전스를 상대로 낸 소송에서는 원고 측이 유리한 판단을 받았지만, 작가들이 메타를 상대로 제기한 소송은 증거 부족으로 기각됐다.
■ 뉴스 콘텐츠가 사라지는 시대, RAG 기술이 불러온 충격
특히 뉴스 산업의 충격은 더욱 컸다. 브리태니커와 메리엄-웹스터는 지난 3월 13일 오픈AI를 상대로 소송을 제기하며, 자사의 온라인 기사 약 10만 건이 AI 모델 학습에 무단 활용됐다고 주장했다. 핵심은 RAG 기술이었다. 답변 생성을 위해 실시간으로 외부 데이터를 검색하도록 하는 이 기술을 통해, AI가 마치 브리태니커 기사를 그대로 복사한 것처럼 답변을 제공했다는 것이다. 더 심각한 문제는 AI가 허위 정보를 만들어내면서도 출처를 브리태니커로 표기해 신뢰도를 훼손했다는 점이다.
AI 검색 기업 퍼플렉시티 역시 월스트리트저널과 뉴욕포스트로부터 같은 이유로 소송을 당했다. 언론사들은 "AI 답변이 기사 원문을 대체할 수 있을 정도로 상세해, 사용자가 언론사를 방문하지 않고도 기사 내용을 소비할 수 있게 만든다"고 주장했다. 퍼플렉시티는 요약과 설명에 불과하다고 반박했지만, 법원은 지난 1월 각하 요청을 기각하고 학습부터 출력까지 전 과정을 심리하기로 결정했다.
한국도 예외가 아니다. 지난 1월 지상파 방송 3사는 네이버가 생성형 AI 하이퍼클로바 개발 과정에서 뉴스 콘텐츠를 무단 활용했다며 저작권 침해 및 부정경쟁방지법 위반 혐의로 소송을 제기했다. 4월에는 한국신문협회가 공정거래위원회에 신고했다. 네이버는 "언론사 제휴 약관에 따라 학습을 진행했으며, 문제 제기 이후에는 명시적 동의 없이 학습에 활용하지 않는다"고 밝혔다. 그러나 신문협회는 "생성형 AI 등장 이전에 마련된 약관을 전혀 다른 기술에 적용하는 것은 부적절하다"며 별도 계약과 사전 동의가 필요하다고 강조했다.

■ 갈등에서 협력으로, 라이선스 계약이 만드는 새로운 판도
최근 흥미로운 변화가 감지되고 있다. 대립과 소송으로 점철됐던 AI 저작권 분쟁이 이제는 라이선스 계약을 통한 협력 구조로 전환되고 있는 것이다. 유니버설뮤직그룹은 AI 음악 생성 스타트업 유디오와의 소송을 2025년 10월 합의로 마무리하며, UMG의 음원 및 출판 저작물에 대한 라이선스 계약을 체결했다. 이를 바탕으로 2026년 출시될 새로운 생성형 AI 음악 플랫폼을 공동 개발한다는 계획이다. 워너뮤직그룹도 11월 유디오 및 수노와 비슷한 조건으로 합의했다.
오픈AI는 뉴스코퍼레이션과 라이선스 계약을 체결하며 월스트리트저널, 뉴욕포스트, 데일리 텔레그래프 등의 최신 기사와 아카이브 콘텐츠에 접근할 수 있게 됐다. 뉴욕타임스도 아마존과 뉴스 콘텐츠 라이선스 계약을 맺었다. 이러한 계약들은 단순히 데이터 사용 권한을 주는 것을 넘어, 콘텐츠 요약 및 발췌 시 실시간으로 출처를 명시하고, 원저작물의 기여도를 정량적으로 산정해 보상하는 체계를 구축하는 방향으로 설계되고 있다.
업계 관계자들은 이를 갈등 완화와 신뢰 구축의 전환점으로 평가한다. 콘텐츠 제공자는 정당한 보상을 받고, AI 기업은 안정적인 데이터 공급원을 확보하며, 사용자는 투명하고 신뢰할 수 있는 AI 서비스를 경험하게 되는 선순환 구조가 만들어질 수 있기 때문이다.
■ 한국은 표시 의무화로 대응, 실효성 논란은 남아
한국 정부는 법적 분쟁보다는 제도적 틀을 먼저 구축하는 전략을 택했다. 2024년 11월 국회에 발의된 저작권법 개정안은 AI를 이용해 제작된 저작물에 대해 그 사실을 표시하도록 의무화하는 내용을 담고 있다. 문화체육관광부와 한국저작권위원회는 2026년 4월 「생성형 인공지능의 저작물 학습에 대한 저작권법상 공정이용 안내서」를 발간하며 공정 이용 판단의 4대 기준을 제시했다. 이용의 목적 및 성격, 저작물의 종류 및 용도, 이용된 비중과 중요성, 시장 및 가치에 미치는 영향 등이다.

또한 공공누리 자유이용허락 표시 기준에 '제0유형'과 '인공지능유형'을 신설해, 공공저작물의 AI 학습 활용 범위를 명확히 했다. 제0유형은 모든 목적에 조건 없이 이용 가능하며, 인공지능유형은 AI 학습 목적에 한해 자유롭게 이용할 수 있다. 전용 상담 및 분쟁 조정 창구도 개설됐다.
하지만 실효성 논란도 뒤따른다. AI 생성물에 대한 표시 의무가 실제로 얼마나 준수될지, 그리고 이를 위반했을 때 어떤 법적 책임이 부과될지는 여전히 불분명하다. 특히 국경을 넘나드는 AI 서비스의 특성상 국내 법만으로는 한계가 있다는 지적도 나온다.
■ 미국 저작권청 보고서가 던진 화두
미국 저작권청은 2023년부터 AI와 저작권 문제를 체계적으로 분석해 보고서를 발표하고 있다. 2024년 7월 디지털 복제물에 관한 1부, 2025년 1월 AI 생성물의 저작권 인정 여부에 관한 2부에 이어, 5월에는 생성형 AI 훈련에 관한 3부를 공개했다. 보고서는 AI 훈련에 저작물을 사용하는 것이 복제권 침해의 일종이 될 수 있지만, 공정 이용 항변이 가능하다는 입장을 밝혔다. 다만 AI 생성물이 원저작물과 실질적으로 유사할 경우 침해로 판단될 수 있다고 덧붙였다.
이러한 판단 기준은 법원의 판결에도 영향을 미치고 있다. 앤트로픽 사건에서 법원이 '변형적 이용'을 인정한 것도 같은 맥락이다. 하지만 뉴욕타임스 대 오픈AI 사건처럼, 뉴스 콘텐츠가 실시간 라이선스 시장을 형성하고 있는 경우에는 공정 이용 항변이 약할 수 있다는 분석도 나온다.
■ 결국 데이터 출처가 운명을 가른다
2025년 한 해 동안 70여 건의 AI 저작권 소송이 제기됐다. 애플, 세일즈포스, 어도비 등 거대 기업들도 Books3, RedPajama 같은 해적판 데이터셋을 사용했다는 이유로 소송에 휘말렸다. 틱톡의 모회사 바이트댄스는 유튜브 영상을 무단 스크래핑하여 MagicVideo 모델을 훈련시킨 혐의로 DMCA 위반 소송을 당했다. 디즈니, 유니버설, 워너브라더스는 미드저니를 상대로 마블과 스타워즈 캐릭터 저작권 침해 소송을 제기했다.
법원들이 공통적으로 강조하는 것은 데이터 출처의 적법성이다. 합법적으로 구매하거나 라이선스를 받은 데이터로 학습했다면 공정 이용 가능성이 높지만, 해적판이나 무단 스크래핑으로 얻은 데이터를 사용했다면 변형적 이용 주장이 힘을 잃는다. 결국 AI 기업들은 학습 데이터의 출처를 투명하게 공개하고, 정당한 대가를 지불하는 방향으로 가지 않으면 법적 리스크에서 벗어날 수 없다.
이제 전 세계는 새로운 기준을 모색하고 있다. 창작자의 권리를 보호하면서도 AI 기술 발전을 저해하지 않는 균형점을 찾기 위한 실험이 진행 중이다. 갈등과 협력, 소송과 계약이 공존하는 이 혼란의 시기를 지나, 과연 누가 승자가 될지는 아직 아무도 모른다. 다만 한 가지는 분명하다. 데이터의 주인은 결코 침묵하지 않을 것이며, AI 시대의 창작은 더 이상 누군가의 희생 위에 세워질 수 없다는 사실이다.
