[AI요약] 글로벌 클라우드 서비스 시장의 소수 업체 집중 현상이 빚은 부작용이 가시화되고 있다. 클라우드플레어의 시스템 오류 한 건이 전 세계 수백만 웹사이트의 동시 마비로 이어지며, 디지털 인프라의 취약성이 드러났다. 전문가들은 핵심 서비스가 소수 기업에 편중된 현 구조의 위험성을 경고한다.

요즘 자주 이용하는 인터넷 서비스가 갑자기 접속되지 않는 경험을 했다면, 당신만의 문제가 아닐 가능성이 크다.
가디언과 CNN을 비롯한 외신들은 19일(현지시간), 글로벌 웹 보안 서비스 기업 클라우드플레어(Cloudflare)에서 발생한 시스템 장애가 챗GPT, 스포티파이, X(구 트위터) 등 주요 플랫폼들의 접속 불능 사태를 초래했다고 전했다.
클라우드플레어는 전 세계 수백만 개 웹사이트의 보안을 책임지는 인프라 제공 기업이다. 악성 트래픽 차단과 동시에 웹사이트 성능 최적화를 담당하며, 앱과 API, AI 워크로드까지 보호하는 광범위한 서비스를 운영 중이다.
흥미로운 점은 이런 대형 장애가 최근 한 달 사이 연쇄적으로 터졌다는 사실이다. 지난달에는 아마존웹서비스(AWS)의 버그로 커피 머신과 스마트 가전이 먹통이 되며 미국인들의 일상이 정지됐고, 며칠 뒤 마이크로소프트 애저(Azure) 역시 유사한 트러블을 겪었다.
전문가들은 이 현상을 세 가지 각도로 해석한다. 첫째, 디지털 서비스 없이는 단 하루도 살 수 없을 만큼 의존도가 심화됐다. 둘째, 클라우드 시장이 소수 거대 기업에 집중되면서 한 곳의 문제가 연쇄 마비로 직결된다. 셋째, 사용자들의 기대치가 높아지면서 사소한 장애에도 불만이 폭증한다.
연이은 사고는 빅테크 기업들조차 시스템 리스크에서 자유롭지 못하다는 교훈을 남긴다.
클라우드플레어 측은 이번 사태가 외부 해킹이나 사이버 공격과는 무관하다고 해명했다. 대신 '위협 트래픽' 필터링을 위한 내부 설정 파일이 예상치 못한 규모로 커지면서, 트래픽 처리 소프트웨어에 과부하를 일으켰다는 것이 공식 입장이다.
구체적으로는 일상적인 설정 업데이트 과정에서 파일 크기 제한을 초과하는 바람에 버그가 촉발됐고, 이것이 네트워크 전반의 성능 저하로 확산됐다. 앞서 아마존 사태 역시 두 개의 자동화 시스템이 동일 데이터를 동시 수정하려다 충돌한 것으로 밝혀진 바 있다.
문제의 핵심은 '집중화'다. 전문가들은 대다수 기업과 개인이 아마존, 마이크로소프트, 구글 등 소수 플랫폼에 의존하는 구조 자체가 위험하다고 지적한다. 이들이 인터넷의 중추 신경계 역할을 하기에, 한 곳에서 사고가 터지면 파급력이 기하급수적으로 커진다.

실제로 장애 신고 집계 사이트 다운디텍터(Downdetector)에는 18일 하루에만 210만 건이 넘는 리포트가 접수됐다.
클라우드플레어는 평소 초당 8100만 건의 HTTP 요청을 처리한다. HTTP 요청이란 브라우저가 웹페이지를 불러오거나 특정 동작을 실행하기 위해 서버에 보내는 신호를 뜻한다.
한 달도 안 되는 기간에 세 차례나 대규모 서비스 마비가 반복된 것은 우연으로 치부하기엔 빈도가 잦다. 사용자들은 익숙한 사이트들이 반복적으로 접속 불가 상태에 빠지는 불편을 호소하고 있다.
시스코의 네트워크 모니터링 자료에 따르면, 미국에서는 올해 들어서만 벌써 주요 서비스 중단이 12건 기록됐으며, 여기에는 이번 클라우드플레어 사태가 빠져 있다. 작년에는 23건, 재작년 13건, 2022년 10건이었다. 특히 2024년에는 보안 업체 크라우드스트라이크(Crowdstrike)의 대형 사고로 전 세계 항공편과 의료기관이 마비되는 초유의 혼란이 빚어졌다.
시스코 사우전드아이즈의 인터넷 인텔리전스 책임자 안젤리크 메디나는 "중단 건수 자체는 일정 수준을 유지하지만, 이런 서비스를 활용하는 사이트와 앱이 폭발적으로 늘어나면서 체감 피해가 갈수록 심각해지고 있다"고 분석했다.
네트스카우트의 제품·솔루션 마케팅 담당 부사장 아일린 헤거티는 "인프라 장애는 공급업체의 기술력이나 민간 기업의 IT 역량과 무관하게 발생할 수 있는 본질적 리스크"라며 "이런 기술 트러블은 피할 수 없는 일상적 문제로 받아들여야 한다"고 강조했다.
영국 서리 사이버보안센터의 앨런 우드워드 교수는 클라우드플레어의 역할을 "디지털 공간의 경비원"에 비유했다. 악의적 공격자가 특정 사이트에 요청을 과다 발송해 마비시키는 분산서비스거부(DDoS) 공격을 막기 위해, 사이트 트래픽을 실시간으로 감시하고 필터링하는 게 핵심 기능이라는 설명이다.
우드워드 교수는 "이런 핵심 기술을 제공하는 기업이 극소수에 불과해, 그중 단 한 곳에만 이상이 생겨도 그 충격이 즉각 가시화된다"며 인프라 다변화의 필요성을 역설했다.