앤트로픽이 공식 사후 분석 보고서을 발표하며 클로드 코드의 성능 저하 원인으로 세 가지 제품 레이어 변경 사항을 지목했다.
첫 번째는 3월 4일 단행된 기본 추론 노력 수준의 하향으로, 'high'에서 'medium'으로 낮추면서 UI 지연 문제를 해결하려 했지만 복잡한 작업에서 지능 저하를 일으켰고, 앤트로픽은 4월 7일 이를 되돌려 Opus 4.7 기본값을 'xhigh'로 복원했다.
두 번째는 3월 26일 배포된 프롬프트 캐싱 최적화 버그로, 유휴 세션의 추론 기록이 매 차례 초기화되면서 클로드가 이전 맥락을 기억하지 못하는 것처럼 보이게 했으며 4월 10일 버전 v2.1.101에서 수정됐다.
세 번째는 4월 16일 추가된 시스템 프롬프트 간결화 지시로, 도구 호출 사이 응답을 25단어, 최종 응답을 100단어 이내로 제한한 결과 코딩 품질 평가에서 3% 하락이 발생했고 4월 20일 되돌렸다.
앤트로픽은 세 변경 사항이 서로 다른 시기에 서로 다른 트래픽 구간에 영향을 줬기 때문에 광범위하고 일관성 없는 성능 저하처럼 보였으며, 클로드 코드 CLI·에이전트 SDK·Cowork는 영향을 받았지만 API는 영향을 받지 않았다고 밝혔다.
AMD AI 그룹 수석 디렉터 스텔라 로렌조는 6,852개 세션 파일과 23만 4,000건 이상의 도구 호출을 분석한 상세 보고서를 깃허브에 공개하며 클로드 코드가 복잡한 엔지니어링 작업에 신뢰할 수 없게 됐다고 주장하면서 논란에 불을 붙였다.
앤트로픽은 재발 방지를 위해 더 많은 내부 직원이 동일한 공개 빌드를 사용하도록 하고, 4월 23일부로 전체 구독자의 사용량 한도를 초기화했다.
