인터넷 먹통 사태, 클라우드 집중화의 그림자

[AI요약] 글로벌 클라우드 서비스 시장의 소수 업체 집중 현상이 빚은 부작용이 가시화되고 있다. 클라우드플레어의 시스템 오류 한 건이 전 세계 수백만 웹사이트의 동시 마비로 이어지며, 디지털 인프라의 취약성이 드러났다. 전문가들은 핵심 서비스가 소수 기업에 편중된 현 구조의 위험성을 경고한다.

클라우드플레어가 챗GPT, 스포티파이, X 등 다양한 온라인 서비스에 일시적인 장애를 일으켰다. (이미지=클라우드플레어)

요즘 자주 이용하는 인터넷 서비스가 갑자기 접속되지 않는 경험을 했다면, 당신만의 문제가 아닐 가능성이 크다.

가디언과 CNN을 비롯한 외신들은 19일(현지시간), 글로벌 웹 보안 서비스 기업 클라우드플레어(Cloudflare)에서 발생한 시스템 장애가 챗GPT, 스포티파이, X(구 트위터) 등 주요 플랫폼들의 접속 불능 사태를 초래했다고 전했다.

클라우드플레어는 전 세계 수백만 개 웹사이트의 보안을 책임지는 인프라 제공 기업이다. 악성 트래픽 차단과 동시에 웹사이트 성능 최적화를 담당하며, 앱과 API, AI 워크로드까지 보호하는 광범위한 서비스를 운영 중이다.

흥미로운 점은 이런 대형 장애가 최근 한 달 사이 연쇄적으로 터졌다는 사실이다. 지난달에는 아마존웹서비스(AWS)의 버그로 커피 머신과 스마트 가전이 먹통이 되며 미국인들의 일상이 정지됐고, 며칠 뒤 마이크로소프트 애저(Azure) 역시 유사한 트러블을 겪었다.

전문가들은 이 현상을 세 가지 각도로 해석한다. 첫째, 디지털 서비스 없이는 단 하루도 살 수 없을 만큼 의존도가 심화됐다. 둘째, 클라우드 시장이 소수 거대 기업에 집중되면서 한 곳의 문제가 연쇄 마비로 직결된다. 셋째, 사용자들의 기대치가 높아지면서 사소한 장애에도 불만이 폭증한다.

연이은 사고는 빅테크 기업들조차 시스템 리스크에서 자유롭지 못하다는 교훈을 남긴다.

클라우드플레어 측은 이번 사태가 외부 해킹이나 사이버 공격과는 무관하다고 해명했다. 대신 '위협 트래픽' 필터링을 위한 내부 설정 파일이 예상치 못한 규모로 커지면서, 트래픽 처리 소프트웨어에 과부하를 일으켰다는 것이 공식 입장이다.

구체적으로는 일상적인 설정 업데이트 과정에서 파일 크기 제한을 초과하는 바람에 버그가 촉발됐고, 이것이 네트워크 전반의 성능 저하로 확산됐다. 앞서 아마존 사태 역시 두 개의 자동화 시스템이 동일 데이터를 동시 수정하려다 충돌한 것으로 밝혀진 바 있다.

문제의 핵심은 '집중화'다. 전문가들은 대다수 기업과 개인이 아마존, 마이크로소프트, 구글 등 소수 플랫폼에 의존하는 구조 자체가 위험하다고 지적한다. 이들이 인터넷의 중추 신경계 역할을 하기에, 한 곳에서 사고가 터지면 파급력이 기하급수적으로 커진다.

핵심 클라우드 인프라의 소수 기업 통합 현상으로 서비스 장애가 발생할 경우 그 문제가 광범위하게 체감되고 있다. (이미지=클라우드플레어)

실제로 장애 신고 집계 사이트 다운디텍터(Downdetector)에는 18일 하루에만 210만 건이 넘는 리포트가 접수됐다.

클라우드플레어는 평소 초당 8100만 건의 HTTP 요청을 처리한다. HTTP 요청이란 브라우저가 웹페이지를 불러오거나 특정 동작을 실행하기 위해 서버에 보내는 신호를 뜻한다.

한 달도 안 되는 기간에 세 차례나 대규모 서비스 마비가 반복된 것은 우연으로 치부하기엔 빈도가 잦다. 사용자들은 익숙한 사이트들이 반복적으로 접속 불가 상태에 빠지는 불편을 호소하고 있다.

시스코의 네트워크 모니터링 자료에 따르면, 미국에서는 올해 들어서만 벌써 주요 서비스 중단이 12건 기록됐으며, 여기에는 이번 클라우드플레어 사태가 빠져 있다. 작년에는 23건, 재작년 13건, 2022년 10건이었다. 특히 2024년에는 보안 업체 크라우드스트라이크(Crowdstrike)의 대형 사고로 전 세계 항공편과 의료기관이 마비되는 초유의 혼란이 빚어졌다.

시스코 사우전드아이즈의 인터넷 인텔리전스 책임자 안젤리크 메디나는 "중단 건수 자체는 일정 수준을 유지하지만, 이런 서비스를 활용하는 사이트와 앱이 폭발적으로 늘어나면서 체감 피해가 갈수록 심각해지고 있다"고 분석했다.

네트스카우트의 제품·솔루션 마케팅 담당 부사장 아일린 헤거티는 "인프라 장애는 공급업체의 기술력이나 민간 기업의 IT 역량과 무관하게 발생할 수 있는 본질적 리스크"라며 "이런 기술 트러블은 피할 수 없는 일상적 문제로 받아들여야 한다"고 강조했다.

영국 서리 사이버보안센터의 앨런 우드워드 교수는 클라우드플레어의 역할을 "디지털 공간의 경비원"에 비유했다. 악의적 공격자가 특정 사이트에 요청을 과다 발송해 마비시키는 분산서비스거부(DDoS) 공격을 막기 위해, 사이트 트래픽을 실시간으로 감시하고 필터링하는 게 핵심 기능이라는 설명이다.

우드워드 교수는 "이런 핵심 기술을 제공하는 기업이 극소수에 불과해, 그중 단 한 곳에만 이상이 생겨도 그 충격이 즉각 가시화된다"며 인프라 다변화의 필요성을 역설했다.

김한수 기자

hanskim@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

‘링크의 시대’에서 ‘답변의 시대’로…구글 ‘서치 라이브’가 바꾸는 검색의 질서

서치 라이브는 검색 결과를 읽는 경험보다, 검색과 ‘대화하는’ 경험에 가깝다. 사용자는 구글 앱 안에서 음성으로 질문을 이어가고, 필요하면 카메라로 사물을 비추며 실시간 도움을 받을 수 있다. 이는 검색이 단발성 쿼리에서 벗어나 문맥을 유지하는 세션형 인터페이스로 이동하고 있음을 보여준다.

‘AI’를 향한 아마존의 거대한 ‘20년 승부수’

[AI요약] 20년전 생소한 개념의 클라우드 컴퓨팅 서비스인 AWS를 출시한 후, 해당 서비스를 인터넷 기반 도구에 의존하는 거의 모든 기업에게 필수불가결한...

[AI, 이제는 현장이다③] AI가 커질수록 공격도 빨라진다… 기업 보안이 다시 ‘기본기’로 돌아가야 하는 이유

AI를 말하면서 이제 보안을 따로 떼어놓기는 어렵다. AI가 기업 전반으로 퍼질수록 공격자도 같은 기술을 손에 넣고 있기 때문이다. 문제는 공격의 방향이 완전히 새로워졌다는 데 있지 않다. 오히려 익숙한 공격이 더 빨라지고, 더 값싸지고, 더 넓게 퍼질 수 있게 됐다는 점이 더 중요하다.

‘AI 에이전트 Vs. 일상생활’ 실리콘 밸리와 대중의 격차

빅테크들이 엄청난 자금을 투입하면서 미래 기술로 보고 있는 AI를 우리는 얼마나 활용하고 있을까. AI 에이전트가 차세대 기술의 핵심으로 강조되고 있는 가운데, 미국인의 65%는 업무에 AI를 전혀 사용하지 않는 것으로 나타났다. 혁신적인 기술은 막대한 가치를 창출하지만 그 가치의 대부분은 기술을 개발하고 도입하는 기업과 투자자에게 돌아간다는 지적이 나온다.