인터넷 먹통 사태, 클라우드 집중화의 그림자

[AI요약] 글로벌 클라우드 서비스 시장의 소수 업체 집중 현상이 빚은 부작용이 가시화되고 있다. 클라우드플레어의 시스템 오류 한 건이 전 세계 수백만 웹사이트의 동시 마비로 이어지며, 디지털 인프라의 취약성이 드러났다. 전문가들은 핵심 서비스가 소수 기업에 편중된 현 구조의 위험성을 경고한다.

클라우드플레어가 챗GPT, 스포티파이, X 등 다양한 온라인 서비스에 일시적인 장애를 일으켰다. (이미지=클라우드플레어)

요즘 자주 이용하는 인터넷 서비스가 갑자기 접속되지 않는 경험을 했다면, 당신만의 문제가 아닐 가능성이 크다.

가디언과 CNN을 비롯한 외신들은 19일(현지시간), 글로벌 웹 보안 서비스 기업 클라우드플레어(Cloudflare)에서 발생한 시스템 장애가 챗GPT, 스포티파이, X(구 트위터) 등 주요 플랫폼들의 접속 불능 사태를 초래했다고 전했다.

클라우드플레어는 전 세계 수백만 개 웹사이트의 보안을 책임지는 인프라 제공 기업이다. 악성 트래픽 차단과 동시에 웹사이트 성능 최적화를 담당하며, 앱과 API, AI 워크로드까지 보호하는 광범위한 서비스를 운영 중이다.

흥미로운 점은 이런 대형 장애가 최근 한 달 사이 연쇄적으로 터졌다는 사실이다. 지난달에는 아마존웹서비스(AWS)의 버그로 커피 머신과 스마트 가전이 먹통이 되며 미국인들의 일상이 정지됐고, 며칠 뒤 마이크로소프트 애저(Azure) 역시 유사한 트러블을 겪었다.

전문가들은 이 현상을 세 가지 각도로 해석한다. 첫째, 디지털 서비스 없이는 단 하루도 살 수 없을 만큼 의존도가 심화됐다. 둘째, 클라우드 시장이 소수 거대 기업에 집중되면서 한 곳의 문제가 연쇄 마비로 직결된다. 셋째, 사용자들의 기대치가 높아지면서 사소한 장애에도 불만이 폭증한다.

연이은 사고는 빅테크 기업들조차 시스템 리스크에서 자유롭지 못하다는 교훈을 남긴다.

클라우드플레어 측은 이번 사태가 외부 해킹이나 사이버 공격과는 무관하다고 해명했다. 대신 '위협 트래픽' 필터링을 위한 내부 설정 파일이 예상치 못한 규모로 커지면서, 트래픽 처리 소프트웨어에 과부하를 일으켰다는 것이 공식 입장이다.

구체적으로는 일상적인 설정 업데이트 과정에서 파일 크기 제한을 초과하는 바람에 버그가 촉발됐고, 이것이 네트워크 전반의 성능 저하로 확산됐다. 앞서 아마존 사태 역시 두 개의 자동화 시스템이 동일 데이터를 동시 수정하려다 충돌한 것으로 밝혀진 바 있다.

문제의 핵심은 '집중화'다. 전문가들은 대다수 기업과 개인이 아마존, 마이크로소프트, 구글 등 소수 플랫폼에 의존하는 구조 자체가 위험하다고 지적한다. 이들이 인터넷의 중추 신경계 역할을 하기에, 한 곳에서 사고가 터지면 파급력이 기하급수적으로 커진다.

핵심 클라우드 인프라의 소수 기업 통합 현상으로 서비스 장애가 발생할 경우 그 문제가 광범위하게 체감되고 있다. (이미지=클라우드플레어)

실제로 장애 신고 집계 사이트 다운디텍터(Downdetector)에는 18일 하루에만 210만 건이 넘는 리포트가 접수됐다.

클라우드플레어는 평소 초당 8100만 건의 HTTP 요청을 처리한다. HTTP 요청이란 브라우저가 웹페이지를 불러오거나 특정 동작을 실행하기 위해 서버에 보내는 신호를 뜻한다.

한 달도 안 되는 기간에 세 차례나 대규모 서비스 마비가 반복된 것은 우연으로 치부하기엔 빈도가 잦다. 사용자들은 익숙한 사이트들이 반복적으로 접속 불가 상태에 빠지는 불편을 호소하고 있다.

시스코의 네트워크 모니터링 자료에 따르면, 미국에서는 올해 들어서만 벌써 주요 서비스 중단이 12건 기록됐으며, 여기에는 이번 클라우드플레어 사태가 빠져 있다. 작년에는 23건, 재작년 13건, 2022년 10건이었다. 특히 2024년에는 보안 업체 크라우드스트라이크(Crowdstrike)의 대형 사고로 전 세계 항공편과 의료기관이 마비되는 초유의 혼란이 빚어졌다.

시스코 사우전드아이즈의 인터넷 인텔리전스 책임자 안젤리크 메디나는 "중단 건수 자체는 일정 수준을 유지하지만, 이런 서비스를 활용하는 사이트와 앱이 폭발적으로 늘어나면서 체감 피해가 갈수록 심각해지고 있다"고 분석했다.

네트스카우트의 제품·솔루션 마케팅 담당 부사장 아일린 헤거티는 "인프라 장애는 공급업체의 기술력이나 민간 기업의 IT 역량과 무관하게 발생할 수 있는 본질적 리스크"라며 "이런 기술 트러블은 피할 수 없는 일상적 문제로 받아들여야 한다"고 강조했다.

영국 서리 사이버보안센터의 앨런 우드워드 교수는 클라우드플레어의 역할을 "디지털 공간의 경비원"에 비유했다. 악의적 공격자가 특정 사이트에 요청을 과다 발송해 마비시키는 분산서비스거부(DDoS) 공격을 막기 위해, 사이트 트래픽을 실시간으로 감시하고 필터링하는 게 핵심 기능이라는 설명이다.

우드워드 교수는 "이런 핵심 기술을 제공하는 기업이 극소수에 불과해, 그중 단 한 곳에만 이상이 생겨도 그 충격이 즉각 가시화된다"며 인프라 다변화의 필요성을 역설했다.

김한수 기자

hanskim@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

[현장] 전력·냉각·보안부터 로봇·바이오까지… KAIST 딥테크 스타트업이 제시한 AI 시대 생존 전략

KAIST 창업원이 주최·주관한 ‘KAIST Startup Scaleup Summit 2026’이 지난 18일 서울 코엑스 3층 컨퍼런스홀 E5·E6에서 열렸다. 넥스트라이즈 2026 서울(NextRise 2026, Seoul) 파트너 행사로 마련된 이 행사는 KAIST 스타트업 성장 공동체를 기반으로 투자사와 창업자, 기술 인재가 만나는 스케일업의 장을 표방했다.

"2000조원 메가 프로젝트, 왜 환호 대신 의구심이 먼저인가"

숫자가 모든 것을 말하지는 않는다. 6월 29일 청와대 영빈관에서 공개된 '대한민국 대도약 3대 메가프로젝트'의 청사진은 분명 압도적이었다.

GPT-5.6은 제한 공개, 제미나이는 사용 제한…AI 경쟁은 ‘접근권 전쟁’으로 바뀌었다

생성형 AI 주도권 경쟁의 상황이 급변하고 있다. 최근까지 시장의 관심은 누가 더 강력한 모델을 먼저 공개하느냐에 집중됐다. 그러나 최근 오픈AI(OpenAI), 앤트로픽(Anthropic), 구글(Google), 메타(Meta)를 둘러싼 변화는 양상이 다르다. 이제 중요한 것은 모델 성능만이 아니다. 누가 최상위 모델에 접근할 수 있는지, 어느 기업이 충분한 컴퓨트(compute)를 배정받을 수 있는지, 또 어떤 조직이 정부와 플랫폼 기업이 요구하는 신뢰 기준을 충족할 수 있는지가 AI 경쟁의 핵심 변수로 떠오르고 있다.

[현장] AI가 뉴스를 요약하는 시대, 저널리즘은 무엇으로 살아남나

17일 진행된 ‘AI와 언론(AI & Journalism)’ 세션에서는 뉴스룸과 저널리즘이 AI 시대에 어떤 방식으로 재편되고 있는지가 집중적으로 논의됐다. 먼저 이상덕 매일경제신문 기자가 ‘AI 에이전트 시대 뉴스룸의 생존법: 초압축 시대와 브랜드 어피니티’를 주제로 발제했고, 이어 이은주 서울대학교 교수 겸 CTAI 센터장이 좌장을 맡아 강정수 블루닷에이아이 연구센터장, 이나연 연세대학교 교수, 박아란 고려대학교 교수와 함께 ‘뉴스룸의 전환: AI 시대와 저널리즘의 미래’를 주제로 패널토론을 진행했다.