‘미래 AI 경쟁자’ 훈련시키고 있는 유튜브 크리에이터들

[AI요약] 최근 할리우드에서 대기업간 AI 저작권 침해 소송이 벌어진 가운데, 독점이나 다름없는 영상 플랫폼에 시간과 열정을 쏟아부어 창작한 영상을 주기적으로 업데이트하고 있는 개개인 창작자들의 권리는 누가 대신 지켜줄 수 있을까. 오늘도 AI는 창작자들이 피땀 흘려 만든 영상을 탐욕스럽게 학습하고 있다.

비오3가 생성한 영상들. (이미지=구글 딥마인드)

내가 만든 유튜브 영상이 미래의 ‘AI 경쟁자’를 훈련시키고 있다는 것을 아는 창작자들은 얼마나 될까.

구글이 자사의 AI 모델을 훈련시키기 위해 방대한 유튜브 동영상 라이브러리를 활용하고 있는 것에 대해 블룸버그, CNBC 등 외신이 21(현지시간) 보도했다.

외신에 따르면 구글은 현재 유튜브 크리에이터들의 영상들을 제미나이(Gemini)와 비오3(Veo3) 비디오 및 오디오 생성기를 포함한 자사의 AI 모델을 훈련키는데 활용하고 있는 것으로 나타났다.

익명을 요구한 구글 관계자에 따르면, 구글은 200억개의 유튜브 동영상 카탈로그를 활용해 이러한 최신 AI 도구를 훈련하고 있다. 실제로 구글은 자사의 AI 모델이 유튜브 동영상 저장소를 활용해 훈련하고 있다는 사실을 확인했다고 밝히면서도, 훈련에는 일부 동영상만 사용하며 크리에이터 및 미디어 기업과 체결한 특정 계약을 준수한다고 언론을 통해 해명했다.

그러나 전문가들은 유튜브 동영상을 기업이 이렇게 활용할 경우, 크리에이터와 미디어 기업에 지적 재산권 위기를 초래할 수 있다고 지적하고 있다.

유튜브는 이전에도 이러한 정보를 공유했다고 밝혔지만, 대부분 전문가는 구글이 자사 비디오 라이브러리를 활용해 AI 모델을 훈련시키고 있다는 사실을 크리에이터와 미디어 기업들이 제대로 인지하지 못하고 있다고 비판했다.

유튜브는 플랫폼에 있는 200억개의 동영상 중 어떤 동영상이 몇 개나 AI 훈련에 사용되는지는 밝히지 않고 있다.

그러나 플랫폼의 규모를 고려할 때 전체 동영상의 1%만 학습하더라도 23억분 분량의 콘텐츠가 될 수 있으며, 이는 경쟁 AI 모델이 사용하는 훈련 데이터의 40배가 넘는 것으로 추정된다.

유튜브는 지난해 9월에 게시한 블로그 게시물에서 “유튜브 콘텐츠가 머신러닝 및 AI 애플리케이션을 포함해 제품 경험을 개선하는 데 활용될 수 있다”고 밝혔다. 이는 유튜브에 콘텐츠를 업로드한 사용자들은 구글이 자신의 동영상을 훈련하는 것을 거부할 수 없다는 것을 의미한다.

크리에이터의 디지털 신원보호 전문기업 로티(Loti)의 루크 아리고니 CEO는 “구글은 영상 제작에 많은 시간과 에너지, 그리고 자신만의 생각을 쏟아부은 많은 크리에이터들의 데이터를 수집하고 있을 가능성이 높다”고 지적했다.

그는 “이는 비오3 모델이 크리에이터들의 합성 버전, 즉 조악한 복제품을 만드는 데 도움이 될 수 있으며 크리에이터들에게 공평한 처사가 아니다”고 비판했다.

실제로 구글이 사용자들의 영상을 기반으로 학습하고 있다는 사실은 기업이 지난 5월 시장에서 가장 진보된 AI 영상 생성기 중 하나인 비오3를 발표한 것으로 힘이 실린다.

구글은 비오3 공개 행사에서 배 위에 있는 노인 장면과 픽사 영화 속 동물들이 서로 이야기하는 장면 등 영화 수준의 영상 시퀀스를 선보였다. 시각 및 청각적 요소를 포함한 모든 장면은 전적으로 AI가 생성했다.

비오3 공개한 영화 수준의 영상 시퀀스 중 한 장면. (이미지=구글 딥마인드)

유튜브에 따르면 거의 모든 주요 미디어 회사와 독립 크리에이터들은 매일 평균 2천만개의 동영상을 플랫폼에 업로드한다. 이는 많은 크리에이터들은 자신도 모르게 자신들과 경쟁하거나 대체될 수 있는 시스템을 훈련시키는 데 일조하고 있을지도 모른다는 우려를 불러일으키고 있다.

또한 유튜브 플랫폼에 동영상을 업로드하는 것은 사용자가 유튜브가 해당 콘텐츠에 대한 광범위한 라이선스를 보유하고 있음에 동의하는 것을 의미한다. 서비스 약관에는 “사용자는 유튜브에 해당 콘텐츠를 사용할 수 있는 전 세계적이고 비독점적이며 로열티가 없고, 재라이선스 및 양도 가능한 라이선스를 부여한다”고 명시돼 있다.

그러나 구글 약관에는 비오를 포함한 자사의 생성 AI 제품에 대한 면책 ​​조항을 포함하고 있다. 이는 사용자가 AI 생성 콘텐츠와 관련해 저작권 소송에 직면할 경우, 구글이 법적 책임을 지고 관련 비용을 부담한다는 것을 의미한다.

AI로 인한 저작권 침해 소송은 이미 벌어지고 있다. 월트 디즈니 컴퍼니와 유니버설은 최근 AI 이미지 생성기 ‘미드저니’(Midjourney)를 상대로 저작권 침해를 주장하는 공동소송을 제기했으며, 이는 할리우드에서 제기된 최초의 소송으로 평가된다.

유튜브 대변인은 “우리는 항상 유튜브 콘텐츠를 활용해 제품을 개선해 왔으며 이는 AI의 등장에도 변함이 없다”며 “가드레일의 필요성을 인지하고 AI 시대에 크리에이터들이 자신의 이미지와 초상을 보호할 수 있도록 강력한 보호 장치에 투자해 왔으며, 앞으로도 이를 지속해 나갈 것”이라고 성명서를 통해 밝혔다.

류정민 기자

znryu@daum.net
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

‘링크의 시대’에서 ‘답변의 시대’로…구글 ‘서치 라이브’가 바꾸는 검색의 질서

서치 라이브는 검색 결과를 읽는 경험보다, 검색과 ‘대화하는’ 경험에 가깝다. 사용자는 구글 앱 안에서 음성으로 질문을 이어가고, 필요하면 카메라로 사물을 비추며 실시간 도움을 받을 수 있다. 이는 검색이 단발성 쿼리에서 벗어나 문맥을 유지하는 세션형 인터페이스로 이동하고 있음을 보여준다.

‘AI’를 향한 아마존의 거대한 ‘20년 승부수’

[AI요약] 20년전 생소한 개념의 클라우드 컴퓨팅 서비스인 AWS를 출시한 후, 해당 서비스를 인터넷 기반 도구에 의존하는 거의 모든 기업에게 필수불가결한...

[AI, 이제는 현장이다③] AI가 커질수록 공격도 빨라진다… 기업 보안이 다시 ‘기본기’로 돌아가야 하는 이유

AI를 말하면서 이제 보안을 따로 떼어놓기는 어렵다. AI가 기업 전반으로 퍼질수록 공격자도 같은 기술을 손에 넣고 있기 때문이다. 문제는 공격의 방향이 완전히 새로워졌다는 데 있지 않다. 오히려 익숙한 공격이 더 빨라지고, 더 값싸지고, 더 넓게 퍼질 수 있게 됐다는 점이 더 중요하다.

‘AI 에이전트 Vs. 일상생활’ 실리콘 밸리와 대중의 격차

빅테크들이 엄청난 자금을 투입하면서 미래 기술로 보고 있는 AI를 우리는 얼마나 활용하고 있을까. AI 에이전트가 차세대 기술의 핵심으로 강조되고 있는 가운데, 미국인의 65%는 업무에 AI를 전혀 사용하지 않는 것으로 나타났다. 혁신적인 기술은 막대한 가치를 창출하지만 그 가치의 대부분은 기술을 개발하고 도입하는 기업과 투자자에게 돌아간다는 지적이 나온다.