클라우드플레어 "퍼플렉시티, 웹사이트 크롤링 차단 우회 위해 '스텔스 크롤러' 사용"

Cloudflare announced that AI-powered answer engine Perplexity is using stealth, undeclared crawlers to evade website no-crawl directives. When Perplexity's declared user agent is blocked, the company repeatedly obscures its crawling identity by using hidden crawlers that impersonate Google Chrome browsers to circumvent website preferences. Cloudflare created new test domains with robots.txt files that prohibited all automated access and WAF rules blocking Perplexity's crawlers; yet, Perplexity was still able to provide detailed information about the restricted content. This stealth crawler utilizes multiple IP addresses not listed in Perplexity's official IP range and rotates through different ASNs to evade website blocks. Cloudflare stated this behavior violates web crawling standards outlined in RFC 9309 and has delisted Perplexity as a verified bot while adding blocking heuristics to their managed rules. In contrast, OpenAI demonstrates best practices by clearly outlining their crawlers, respecting robots.txt, and not attempting additional crawling when blocked. Currently, over 2.5 million websites have chosen to disallow AI training through Cloudflare's managed features completely.

클라우드플레어가 AI 검색엔진 퍼플렉시티가 웹사이트의 크롤링 금지 지시를 우회하기 위해 은밀한 크롤러를 사용하고 있다고 발표했다. 퍼플렉시티는 공식 선언된 사용자 에이전트로 크롤링을 시도하다가 네트워크 차단을 당하면, 구글 크롬 브라우저로 위장한 숨겨진 크롤러를 사용해 크롤링 신원을 은폐하는 행위를 반복적으로 보였다. 클라우드플레어는 robots.txt 파일로 모든 자동화된 접근을 금지하고 WAF 규칙으로 퍼플렉시티 크롤러를 차단한 새로운 테스트 도메인을 생성했지만, 퍼플렉시티는 여전히 해당 콘텐츠에 대한 상세한 정보를 제공할 수 있었다. 이 은밀한 크롤러는 퍼플렉시티의 공식 IP 범위에 없는 여러 IP 주소를 사용하며, 차단을 우회하기 위해 다른 ASN을 통해 IP를 순환시키는 행위를 보였다. 클라우드플레어는 이러한 행위가 웹 크롤링 표준인 RFC 9309에 위배된다며 퍼플렉시티를 검증된 봇 목록에서 제외하고 관리 규칙에 차단 휴리스틱을 추가했다. 반면 오픈AI는 크롤러를 명확히 공개하고 robots.txt를 존중하며 차단 시 추가 크롤링 시도를 하지 않는 모범 사례를 보여준다고 평가했다. 현재 250만 개 이상의 웹사이트가 클라우드플레어의 관리 기능을 통해 AI 훈련용 크롤링을 완전히 차단하고 있다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

“몸값 3조 육박, K-엔비디아 떴다”… 리벨리온, 4억 달러 유치하며 미국 정조준

국내 AI 반도체 스타트업 리벨리온이 4억 달러(약 6,000억 원) 규모의 대규모 투자 유치에 성공하며 글로벌 시장 진출을 위한 ‘실탄’을 확보했다.

블루스카이 AI 도입에 유저 12만 명 ‘집단 차단’

탈(脫)중앙화 소셜미디어 블루스카이가 선보인 인공지능(AI) 비서 ‘아티(Attie)’가 출시와 동시에 사용자들의 거센 역풍을 맞고 있다.

"미국인 80% AI 우려, Z세대 가장 비관적"...미국 설문조사 결과

퀴니피액 대학 여론조사에서 미국인의 AI 활용률은 높아졌지만 신뢰도는 21%에 그쳤고, 70%는 AI가 일자리를 줄일 것으로 우려했다. Z세대의 비관론이 가장 강했다.

코파일럿 코워크, MS 프런티어 프로그램 통해 첫 공개…앤트 로픽 기술 탑재

마이크로소프트가 앤스로픽과 협력해 개발한 AI 업무 자동화 기능 '코파일럿 코워크'를 프런티어 조기 체험 프로그램으로 공개했다. 사용자가 목표를 설명하면 AI가 계획을 세우고 마이크로소프트 365 전반에서 작업을 직접 수행한다.