Reddit has filed a lawsuit against AI startup Anthropic, alleging that the company unlawfully collected Reddit data over several years to train its AI model, Claude. According to the complaint, Anthropic has been using Reddit content as training data since at least December 2021. Reddit also submitted a screenshot in which Claude appears to acknowledge being trained on Reddit data. Despite repeated warnings, Reddit claims that Anthropic accessed or attempted to access its platform at least 100,000 times through automated means. Reddit, which has already monetized its data through licensing agreements with companies like Google and OpenAI, maintains a hardline stance against unauthorized scraping. The company made clear that Anthropic is no exception. Reddit emphasized that Anthropic not only refused to engage in licensing negotiations but also failed to uphold basic user rights, such as removing deleted content from its systems. Anthropic, for its part, has denied Reddit’s claims and stated that it will respond through legal channels.
레딧이 AI 스타트업 앤스로픽을 상대로 소송을 제기했다. 레딧은 앤스로픽이 수년간 자사 데이터를 무단으로 수집해 인공지능 모델 ‘Claude’ 학습에 사용했다고 주장했다. 소장에 따르면 앤스로픽은 최소 2021년 12월부터 레딧 콘텐츠를 학습 데이터로 활용해왔으며, Reddit 측은 Claude가 이를 인정하는 듯한 대화 스크린샷도 증거로 제출했다. 레딧은 반복된 경고에도 불구하고 앤스로픽이 자동화된 방식으로 최소 10만 회 이상 레딧에 접근하거나 접근을 시도했다고 밝혔다. 레딧은 이미 Google, OpenAI 등과 데이터 라이선스 계약을 맺으며 수익화에 나선 상태다. 이에 따라 무단 크롤링에 대해 강경한 입장을 유지하고 있으며, 앤스로픽 또한 이에 예외가 될 수 없다는 입장을 분명히 했다. Reddit은 특히 앤스로픽이 라이선스 협상에 응하지 않았고, 삭제된 게시물 제거 등 기본적인 사용자 권리 보호조차 거부했다고 지적했다. 한편 앤스로픽 측은 Reddit의 주장에 동의하지 않으며 법적 대응에 나서겠다고 밝혔다.
