"17만 개 유튜브 영상, AI 기업들 무단으로 학습"

An investigation by Proof News and Wired revealed that over 170,000 YouTube videos were part of a massive dataset used to train AI systems for major tech companies. Apple, Anthropic, Nvidia, and Salesforce are among those who used the 'YouTube Subtitles' data extracted without permission. The dataset includes subtitles from videos of popular creators and major news outlets. YouTube has not immediately responded to the findings. AI companies rarely show transparency about the data used in their AI systems. In previous interviews, YouTube CEO Neal Mohan stated that using video content for AI training would violate the platform's terms. Google CEO Sundar Pichai agreed with this assessment, emphasizing the importance of abiding by terms and conditions when building products.

조사에 따르면, 주요 빅테크 기업들이 AI 훈련을 위해 17만 개 이상의 유튜브 동영상을 데이터셋으로 활용했다고 밝혀졌다. 애플, 앤스로픽, 엔비디아, 세일즈포스 등이 허가없이 유튜브에서 추출한 '유튜브 자막(YouTube Subtitles)' 데이터를 사용했다. 이 데이터셋에는 MrBeast, Marques Brownlee 등 유명 크리에이터와 주요 뉴스 매체의 영상 자막이 포함되어 있다. 유튜브는 이에 대한 즉각적인 답변을 하지 않았다. AI 기업들은 자사 AI 시스템에 사용된 데이터에 대해 거의 투명성을 보이지 않고 있다. 유튜브 CEO는 이전 인터뷰에서 AI 훈련을 위한 동영상 콘텐츠 사용이 플랫폼 이용약관을 위반한다고 말한 바 있다. 구글 CEO도 이러한 견해에 동의했다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

미국서 지메일 주소 바꿀 수 있다...글로벌은 불투명

구글이 지메일 출시 20년 만에 처음으로 이메일 주소 변경 기능을 공식 배포했다. 인도에 먼저 출시된 뒤 미국으로 확대됐으며, 한국 등 다른 국가의 배포 일정은 아직 미정이다.

“음식 칼로리 계산하고 3개국어 번역까지… 메타, ‘진화한 스마트 안경’ 전격 공개”

메타가 레이밴(Ray-Ban)의 모회사 에실로룩소티카와 협력해 인공지능(AI) 기능을 대폭 강화한 차세대 스마트 안경 ‘옵틱스(Optics)’ 라인업을 선보였다.

'커친놈' 손목에 채워진 구글의 비밀… 커리, AI 웨어러블 전격 예고”

미국 프로농구(NBA)의 슈퍼스타 스테판 커리가 구글과 협력해 개발한 새로운 웨어러블 기기를 공개하며 전 세계 IT 및 스포츠 팬들의 이목을 집중시키고 있다.

양자 컴퓨터의 암호화폐 위협, 예상보다 20배 빨라진다…구글 연구팀 경고

구글 양자 AI 연구팀이 미래 양자 컴퓨터가 비트코인 등 암호화폐 보안을 기존 예상보다 20배 적은 자원으로 뚫을 수 있다고 경고하며, 2029년까지 양자 내성 암호 전환을 촉구했다.