앤트로픽이 9일 공개한 새 AI 모델 '페이블 5(Fable 5)'가 보안 연구자들의 거센 반발에 부딪혔다.
페이블은 앤트로픽의 사이버보안 특화 최고 모델 '미토스의 공개 버전으로, 보안·생물학 관련 쿼리를 자동으로 차단하고 구형 모델인 클로드 오퍼스 4.8로 전환하는 '가드레일'이 탑재되어 있다.
IBM X-포스 소속 보안 연구원 발렌티나 팔미오티는 "블로그 글 읽기처럼 사이버 보안과 간접적으로만 관련된 요청도 무조건 차단된다"고 지적했다. 사이버보안 전문가 매트 수이체는 가드레일이 키워드 기반으로 작동해, '보안 코드 작성'처럼 일반적인 소프트웨어 엔지니어링 요청까지 제한당한다고 비판했다.
일부 분석에 따르면, 페이블 5의 안전 분류기는 사이버보안·생물학·화학·모델 증류 주제를 트리거로 삼으며, 앤트로픽은 전체 세션의 약 95%가 이 제한을 받지 않는다고 밝혔다. 앤트로픽은 전문 보안 연구자가 '사이버 검증 프로그램'을 통해 승인받을 경우 제한을 완화해 준다는 방침이지만, 즉각적인 반응이 어렵다는 점에서 비판이 계속되고 있다. 수이체는 "초기 출시 단계인 만큼 시간이 지나면서 가드레일이 완화될 것"이라며 완전한 거부보다는 단계적 조정이 현실적이라는 입장을 밝혔다.
