Google Cloud and Cloudflare have officially apologized for the recent large-scale cloud outage. The incident temporarily disrupted access to many popular websites and applications, including Spotify and Discord. Google stated that the outage, which occurred from 10:51 a.m. to 6:18 p.m. on June 12, was caused by an error during a Service Control policy update. An unintended blank field was inserted into the policy data, causing repeated system crashes and requiring up to three hours for full recovery. Google announced plans to modularize the Service Control architecture and strengthen resilience by implementing a “fail open” approach in case of future failures. Cloudflare also experienced a two-and-a-half-hour service disruption on the same day. The cause was traced to the underlying storage infrastructure of its core data store, Workers KV, which partially relies on Google Cloud. Cloudflare said it would reduce single-vendor dependencies and enhance infrastructure redundancy as part of its measures to prevent recurrence. Both companies emphasized that the outage was due to internal system errors, not hacking or a security breach. No data was lost, and there was no direct impact on major network services.
구글 클라우드와 클라우드플레어가 최근 발생한 대규모 클라우드 장애에 대해 공식적으로 사과했다. 이번 장애로 인해 Spotify, Discord 등 다수의 인기 웹사이트와 애플리케이션이 일시적으로 접속 불가 상태를 겪었다. 구글은 6월 12일 오전 10시 51분부터 오후 6시 18분까지 서비스 컨트롤 정책 변경 과정에서 발생한 오류가 장애의 원인이라고 밝혔다. 정책 데이터에 의도치 않은 빈 필드가 삽입되면서 시스템이 반복적으로 다운됐고, 복구에는 최대 3시간이 소요됐다. 구글은 향후 서비스 컨트롤 아키텍처를 모듈화하고, 장애 발생 시 ‘fail open’ 방식 등 복원력을 강화할 계획이다. 클라우드플레어 역시 같은 날 2시간 30분 동안 서비스 장애를 겪었다. 핵심 데이터 저장소인 Workers KV의 기반 스토리지 인프라가 구글 클라우드에 일부 의존하고 있었던 것이 원인으로 지목됐다. 클라우드플레어는 단일 벤더 의존성을 줄이고, 인프라 중복성을 강화하는 등 재발 방지 대책을 마련하겠다고 밝혔다. 양사는 이번 장애가 해킹이나 보안 사고가 아니라 시스템 내부 결함에 의한 것임을 강조했다. 데이터 유실은 없었으며, 주요 네트워크 서비스에는 직접적 피해가 없었던 것으로 확인됐다.
