오픈AI, 스마트 컨트랙트 보안 AI 평가 도구 'EVMbench' 공개

오픈AI가 크립토 전문 벤처투자사 패러다임(Paradigm)과 공동으로 AI가 블록체인 스마트 컨트랙트의 보안 취약점을 얼마나 잘 잡아낼 수 있는지 측정하는 벤치마크 도구 'EVM벤치(EVMbench)'를 공개했다.

스마트 컨트랙트란 이더리움같은 블록체인 위에서 자동으로 실행되는 코드로, 탈중앙화 금융(DeFi) 프로토콜과 토큰 거래 등 현재 1,000억 달러(약 144조4,000억 원) 이상의 자산을 관리하고 있다.

EVMbench는 실제 보안 감사와 해킹 경연대회에서 수집한 40개 감사 결과의 취약점 120개를 바탕으로, AI 에이전트의 능력을 '탐지·패치·익스플로잇' 세 가지 항목으로 평가한다.

테스트 결과 오픈AI의 최신 모델 GPT-5.3-Codex는 익스플로잇 모드에서 72.2%를 기록해, 6개월 전 출시된 GPT-5의 31.9%에 비해 크게 향상된 성능을 보였다.

오픈AI는 EVMbench 출시와 함께 보안 연구 AI 에이전트 '아드바크(Aardvark)'의 프라이빗 베타를 확대하고, 사이버보안 그랜트 프로그램을 통해 방어적 연구 지원에 1,000만 달러(약 144억 원) 규모의 API 크레딧을 투입하기로 했다.

오픈소스 프로젝트와 핵심 인프라를 대상으로 무료 코드베이스 스캐닝 서비스도 제공할 예정이다. 패러다임은 "프로젝트 초기 AI 모델의 익스플로잇 성공률은 20% 미만이었으나, 지금은 70%를 넘었다"며 "향후 스마트 컨트랙트 감사의 상당 부분을 AI 에이전트가 담당하게 될 것"이라고 밝혔다.

앨리스

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

유튜브, ‘코첼라 2026’ 전 세계 무료 생중계

세계 최대 음악 축제인 ‘코첼라 밸리 뮤직 앤드 아츠 페스티벌(이하 코첼라)’을 안방에서 고화질로 즐길 수 있게 됐다.

머스크의 스페이스X, IPO 추진…xAI 합병·나스닥 편입 가능성까지

스페이스X가 SEC에 IPO 비공개 서류를 제출했다. 목표 조달액 750억 달러로 역대 최대 규모다. xAI 합병 리스크와 나스닥 100 자동 편입 가능성도 주목된다.

오픈AI, 애플 카플레이용 ‘AI 음성 비서’ 전격 출시

운전 중 스마트폰을 만지지 않고도 생성형 AI와 자유롭게 대화할 수 있는 시대가 열렸다. 1일(현지시간) 오픈AI는 애플의 차량용 인포테인먼트 시스템인 '카플레이(CarPlay)'에 챗GPT 음성 모드를 공식 지원한다고 밝혔다.

클라우드플레어, 워드프레스 대안 CMS '엠대시' 공개

클라우드플레어가 AI로 두 달 만에 개발한 오픈소스 CMS '엠대시'를 공개했다. 워드프레스 플러그인 보안 문제를 격리 샌드박스로 해결하고 AI 에이전트 관리 기능을 기본 탑재했다.