넷플릭스가 영상에서 특정 물체를 지우고 그 물리적 영향까지 자동으로 재생성하는 AI 모델 'VOID'를 오픈소스로 공개했다.
VOID는 '비디오 오브젝트 앤드 인터랙션 딜리션(Video Object and Interaction Deletion)'의 약자로, 물체를 단순히 지우는 데 그치지 않고 해당 물체가 없었을 때 나머지 장면이 물리적으로 어떻게 바뀔지를 함께 생성하는 비전-언어 모델(vision-language model)이다.
예를 들어 기타를 들고 있는 사람을 영상에서 삭제하면, VOID는 그 사람이 받쳐주던 기타가 중력에 의해 자연스럽게 떨어지는 장면을 자동으로 만들어낸다. 두 차량의 정면충돌 영상에서 한 대를 지우면, 충돌 잔해·연기·불꽃이 사라지고 남은 차량이 빈 도로를 달리는 자연스러운 영상으로 바뀐다.

이 모델은 넷플릭스가 처음 공개한 오픈소스 AI로, 아파치 2.0 라이선스로 배포돼 상업적 활용도 가능하다.
25명을 대상으로 한 사용자 선호도 조사에서 VOID는 64.8%의 선택을 받았으며, 유료 서비스인 런웨이는 18.4%에 그쳤다. 다만 모델 실행에 40GB 이상의 VRAM을 갖춘 GPU가 필요해, 일반 소비자보다는 전문 제작 환경에 적합하다.
