레딧, AI 데이터 수집 막기 위해 인터넷 아카이브 접근 제한

Reddit has confirmed that AI companies have been scraping its data through the Internet Archive’s Wayback Machine and has decided to block indexing access to most posts, comments, and profiles. Going forward, the Wayback Machine will only be able to index Reddit’s main homepage. Reddit stated that “AI companies are scraping data in violation of platform policies” and plans to maintain these restrictions for the time being to protect its users. Last year, Reddit signed a deal with Google to provide AI training data and has also blocked major search engines from crawling its data unless they pay fees. While Reddit has agreements with OpenAI, it has taken a tough stance against unauthorized data scraping by suing Anthropic. The Wayback Machine’s operators have said they are continuing ongoing discussions with Reddit.

레딧이 AI 기업들이 인터넷 아카이브의 웨이백 머신을 통해 자사 데이터를 무단 수집하는 것을 확인하고, 대부분 게시물과 댓글, 프로필에 대한 색인 접근을 차단하기로 했다. 앞으로 웨이백 머신은 레딧 메인 페이지 정도만 색인할 수 있다. 레딧 측은 “AI 기업들이 플랫폼 정책을 위반하며 데이터를 스크래핑하고 있다”며, 이용자 보호를 위해 당분간 제한 조치를 유지할 계획이라고 밝혔다. 레딧은 지난해 구글과 AI 학습 데이터 제공 계약을 체결했으며, 주요 검색엔진에도 비용을 지불하지 않으면 데이터 크롤링을 막고 있다. 또한 오픈AI와 계약을 맺었으나, 앤트로픽에 대해서는 소송을 제기하는 등 데이터 무단 수집에 강경 대응하고 있다. 웨이백 머신 운영진은 레딧과 지속적인 논의를 이어가고 있다고 전했다.

앨리스

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

삼성, 멀미 완화 앱 '히어라피' 출시...이어폰으로 60초 들으면 2시간 효과

삼성이 이어폰으로 멀미를 완화하는 무료 앱 '히어라피'를 출시했다. 100Hz 저음 사인파를 60초간 들으면 최대 2시간 멀미 증상이 억제되며, 갤럭시 버즈4 프로 외 타사 이어폰에서도 사용 가능하다.

“남들 다 포기할 때 거꾸로 간다”… 토요타, 볼보·다임러와 ‘수소 동맹’ 전격 결성

세계 최대 자동차 기업 토요타가 전기차로 쏠린 업계 흐름에 맞서 수소 연료전지 시장에 승부수를 던졌다.

이란, 애플·구글·마이크로소프트 등 미국 기업 18곳 타격 경고

이란 혁명수비대(IRGC)가 애플·구글·마이크로소프트 등 미국 기업 18곳을 중동에서 타격하겠다고 경고했다. 4월 1일 오후 8시(테헤란 기준)를 데드라인으로 제시하며 직원 대피를 촉구했다.

음식 칼로리 계산하고 3개국어 번역까지… 메타, ‘진화한 스마트 안경’ 전격 공개”

메타가 레이밴(Ray-Ban)의 모회사 에실로룩소티카와 협력해 인공지능(AI) 기능을 대폭 강화한 차세대 스마트 안경 ‘옵틱스(Optics)’ 라인업을 선보였다.