오픈AI “AI 브라우저, 프롬프트 인젝션 근본 해결 어렵다”

오픈AI(OpenAI)가 자사 AI 브라우저 ‘아틀라스(Atlas)’의 보안을 강화하고 있지만, 프롬프트 인젝션 공격은 당분간 완전히 차단하기 어렵다고 밝혔다.

프롬프트 인젝션은 웹페이지나 이메일 속에 숨겨진 악성 명령을 이용해 AI 에이전트의 동작을 조작하는 공격 형태다. 오픈AI는 이를 “웹상의 사회공학 공격처럼 영구적으로 해결되기 어려운 문제”라고 설명했다.

오픈AI는 최근 블로그를 통해 에이전트 모드가 보안 위협 범위를 넓히지만, 신속한 대응·패치 시스템을 통해 방어를 강화하고 있다고 밝혔다. 실제로 ‘LLM 기반 자동 공격자(LLM-based automated attacker)’라는 강화학습 모델을 도입해 내부 테스트 단계에서 새로운 공격 시나리오를 사전에 탐지하는 체계를 구축했다.

이 시스템은 해커 역할을 수행하는 AI 봇이 공격 시뮬레이션을 반복하며, 대상 AI의 반응을 분석해 취약점을 찾아내는 방식이다. 오픈AI에 따르면 해당 구조는 인간 레드팀보다 더 빠르게 보안 결함을 식별할 수 있다.

오픈AI는 “프롬프트 인젝션은 장기적인 AI 보안 과제”라며, 대규모 테스트와 빠른 보안 업데이트를 통해 실제 공격으로 이어지기 전 대응력을 높이겠다고 밝혔다.

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

“몸값 3조 육박, K-엔비디아 떴다”… 리벨리온, 4억 달러 유치하며 미국 정조준

국내 AI 반도체 스타트업 리벨리온이 4억 달러(약 6,000억 원) 규모의 대규모 투자 유치에 성공하며 글로벌 시장 진출을 위한 ‘실탄’을 확보했다.

블루스카이 AI 도입에 유저 12만 명 ‘집단 차단’

탈(脫)중앙화 소셜미디어 블루스카이가 선보인 인공지능(AI) 비서 ‘아티(Attie)’가 출시와 동시에 사용자들의 거센 역풍을 맞고 있다.

"미국인 80% AI 우려, Z세대 가장 비관적"...미국 설문조사 결과

퀴니피액 대학 여론조사에서 미국인의 AI 활용률은 높아졌지만 신뢰도는 21%에 그쳤고, 70%는 AI가 일자리를 줄일 것으로 우려했다. Z세대의 비관론이 가장 강했다.

코파일럿 코워크, MS 프런티어 프로그램 통해 첫 공개…앤트 로픽 기술 탑재

마이크로소프트가 앤스로픽과 협력해 개발한 AI 업무 자동화 기능 '코파일럿 코워크'를 프런티어 조기 체험 프로그램으로 공개했다. 사용자가 목표를 설명하면 AI가 계획을 세우고 마이크로소프트 365 전반에서 작업을 직접 수행한다.