앤트로픽이 개발한 AI 코딩 도구 클로드 코드의 내부 소스코드 전체가 실수로 인터넷에 공개됐다.
3월 31일 아침, npm 공개 저장소에 올라온 버전 2.1.88에 내부용 디버깅 파일(59.8MB)이 실수로 포함됐고, 솔라이어 랩스 인턴 차오판 쇼우가 이를 발견해 X(트위터)에 올리면서 수 시간 만에 51만여 줄의 코드가 깃허브를 통해 전 세계로 퍼졌다.
앤트로픽은 "고객 데이터나 계정 정보 유출은 없었으며, 보안 침해가 아닌 패키지 배포 과정의 인적 실수"라고 공식 입장을 밝혔다. 클로드 코드는 앤트로픽의 핵심 수익원으로, 올해 연간 반복 매출(ARR)이 25억 달러(약 3조 7,875억원)에 달하며 연초 대비 두 배 이상 성장한 상태여서 이번 유출로 인한 타격이 더욱 크다는 분석이 나온다.
유출된 코드에서 가장 눈길을 끈 것은 'KAIROS'라는 미공개 기능으로, 사용자가 자리를 비운 사이에도 AI가 혼자 계속 작동하며 정보를 정리하는 '상시 실행 에이전트 모드'다. KAIROS에는 'autoDream'이라는 기능도 포함돼 있는데, AI가 유휴 시간에 스스로 모순된 정보를 걸러내고 메모를 정리해 사용자가 돌아올 때 깔끔한 작업 환경을 만들어준다.
또 하나 논란이 된 것은 '언더커버 모드(Undercover Mode)'로, 오픈소스 코드 저장소에 기여할 때 AI가 작업했다는 사실을 커밋 메시지 등 기록에 남기지 않도록 설계된 기능이다.
내부 모델 코드명도 드러났는데, 'Capybara'는 클로드 4.6, 'Fennec'은 오퍼스 4.6, 'Numbat'은 아직 출시되지 않은 모델을 가리키며, 최신 Capybara의 내부 오류율이 이전 버전보다 오히려 높아졌다는 벤치마크 수치도 함께 공개됐다.
유출 직전인 3월 31일 새벽 00시 21분~03시 29분(UTC) 사이에 npm으로 클로드 코드를 업데이트한 사용자는 악성코드가 심어진 axios 패키지를 함께 설치했을 가능성이 있어 즉각적인 점검이 필요하다.
이번 사고는 앤트로픽이 기업공개(IPO)를 준비하는 가운데 며칠 사이 두 번째로 터진 정보 유출로, 회사의 보안 관리 능력에 의문이 제기되고 있다.
앤트로픽은 npm 대신 공식 바이너리 설치 방식 사용을 권고했으며, 현재 npm 사용자는 버전 2.1.88을 즉시 삭제하고 2.1.86으로 되돌린 뒤 API 키를 재발급받아야 한다.
