앤트로픽 '페이블 5' 출시 첫날 반발…사이버보안 연구자들 "키워드만 봐도 막힌다"

앤트로픽이 9일 공개한 새 AI 모델 '페이블 5(Fable 5)'가 보안 연구자들의 거센 반발에 부딪혔다.

페이블은 앤트로픽의 사이버보안 특화 최고 모델 '미토스의 공개 버전으로, 보안·생물학 관련 쿼리를 자동으로 차단하고 구형 모델인 클로드 오퍼스 4.8로 전환하는 '가드레일'이 탑재되어 있다.

IBM X-포스 소속 보안 연구원 발렌티나 팔미오티는 "블로그 글 읽기처럼 사이버 보안과 간접적으로만 관련된 요청도 무조건 차단된다"고 지적했다. 사이버보안 전문가 매트 수이체는 가드레일이 키워드 기반으로 작동해, '보안 코드 작성'처럼 일반적인 소프트웨어 엔지니어링 요청까지 제한당한다고 비판했다.

일부 분석에 따르면, 페이블 5의 안전 분류기는 사이버보안·생물학·화학·모델 증류 주제를 트리거로 삼으며, 앤트로픽은 전체 세션의 약 95%가 이 제한을 받지 않는다고 밝혔다. 앤트로픽은 전문 보안 연구자가 '사이버 검증 프로그램'을 통해 승인받을 경우 제한을 완화해 준다는 방침이지만, 즉각적인 반응이 어렵다는 점에서 비판이 계속되고 있다. 수이체는 "초기 출시 단계인 만큼 시간이 지나면서 가드레일이 완화될 것"이라며 완전한 거부보다는 단계적 조정이 현실적이라는 입장을 밝혔다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

EU, 메타에 왓츠앱 ‘타사 AI 챗봇 차단’ 즉각 중단 명령

유럽연합(EU)이 페이스북과 인스타그램의 모기업 메타(Meta)를 상대로 모바일 메신저 왓츠앱(WhatsApp) 내에서 경쟁사들의 인공지능(AI) 챗봇 서비스를 차단하지 말고 다시 무료로 개방하라는 강제 명령을 내렸다.

“돈 더 내고 새 버전 사라” MS, 맥용 오피스 2019 ‘읽기 전용’ 강제 전환 논란

마이크로소프트(MS)가 디지털 라이선스 인증서 만료를 이유로 다음 달부터 애플 맥(Mac) 운영체제용 ‘오피스 2019’의 핵심 기능을 사실상 무력화하기로 결정했다.

“AI 가짜뉴스 구글이 책임져라” 독일 법원, 검색 면책특권 박탈한 역사적 판결

인공지능(AI)이 생성한 허위 정보에 대해 플랫폼 운영사인 구글에 직접적인 법적 책임이 있다는 유럽 사법당국의 첫 판결이 나왔다.

“머스크가 폭동 키웠다” 영 규제당국, X 등 SNS에 증오 콘텐츠 전면 삭제 명령

북아일랜드 벨파스트에서 발생한 인종차별적 폭동 사태의 여파로 영국 정부가 가짜뉴스와의 전면전을 선포하고 나섰다.