마이크로소프트의 클라우드 플랫폼 애저(Azure)에서 29일(현지시각) 약 8시간에 걸친 글로벌 장애가 발생했다. 이번 사고로 마이크로소프트 자체 서비스뿐만 아니라 알래스카항공, 히드로공항, 영국 통신사 등 다양한 산업 분야의 서비스까지 중단되고, 일부는 지연됐다.
애저 프론트 도어(AFD)라 불리는 글로벌 콘텐츠 및 보안 제공망에서 잘못된 설정 변경이 원인으로 지목됐다. 이로 인해 애저와 연동된 고객사의 포털, 마이크로소프트 365, 액티브 디렉터리 등 핵심 서비스에 대규모 접속 장애가 발생했으며, 일부 지역은 회복까지 장시간이 소요됐다.
마이크로소프트는 사건 직후 모든 설정 변경을 차단하고, 정상 상태로 롤백하는 단계적 복구를 실시했다. AWS가 겪었던 대규모 장애와 유사하게 횡적인 피해가 확산됐으며, 클라우드 서비스 의존도가 높아질수록 한 번의 장애가 연쇄적인 혼란을 초래할 수 있다는 점이 다시 한 번 확인됐다.
