세계 최대 클라우드 서비스 사업자 AWS가 15시간에 걸친 전 세계 서비스 장애를 겪었다. 이번 장애로 결제, 금융거래, 소셜미디어, 상용 소프트웨어 등 다양한 온라인 서비스가 중단되며 수백만 명의 이용자와 1,000여 개 기업에 영향을 미쳤다.
AWS는 도메인 네임 시스템(DNS) 오류가 원인이었다고 밝혔다. 해당 오류로 인해 애플리케이션이 클라우드 데이터베이스인 DynamoDB의 주소를 찾지 못한 것으로 나타났다.
인터넷 모니터링 사이트 다운디텍터에 따르면 약 400만 명의 사용자가 장애를 신고했으며, AWS는 미 동부 기준 오후 6시 1분경 모든 서비스가 정상화됐다고 발표했다.
AWS 파트너사인 센티넬 테크놀로지스의 로버트 케블루섹 최고기술책임자는 “이런 일은 어떤 클라우드 사업자에게도 발생할 수 있다”며 인간의 실수나 장비 문제로 인한 기술적 리스크를 지적했다. 그는 또 “AI 인프라 확장이 클라우드 변화 속도를 높이고 있으며, 이로 인해 유사한 장애 가능성도 커질 수 있다”고 말했다.
