
생성형 AI 확산 이후 기업 경쟁력의 무게중심은 단순한 모델 성능에서 실제 데이터를 얼마나 효율적으로 찾아 쓰느냐로 옮겨가고 있다. 같은 AI 모델을 활용하더라도 어떤 정보를 얼마나 빠르게 찾아내고, 그것을 적절한 맥락으로 연결하느냐에 따라 서비스 품질과 운영 효율이 달라지기 때문이다. 이런 흐름 속에서 디노티시아와 SBS가 방송 아카이브 검색 고도화 작업에 나섰다.
장기기억 AI 및 반도체 통합 솔루션 기업 디노티시아는 SBS와 함께 대규모 방송 영상 아카이브를 대상으로 멀티모달 검색 시스템 고도화를 추진하고 있다고 20일 밝혔다.
양사가 다루는 데이터 규모는 약 10만 시간 분량의 방송 영상으로, 단순 키워드 일치형 검색을 넘어 영상의 의미를 이해하는 검색 체계로 발전시키는 것이 이번 협업의 핵심이다.
이번 고도화 작업은 특정 단어를 입력해 결과를 찾는 방식에서 한 걸음 더 나아간다. 인물, 행동, 배경, 상황 같은 요소를 복합적으로 반영해 원하는 장면을 찾을 수 있도록 하는 것이 목표다. 예컨대 특정 사회 이슈와 관련된 현장 인터뷰 장면이나, 특정한 분위기와 맥락을 가진 화면을 조건 기반으로 탐색하는 식이다. 검색 결과의 신뢰성과 정확성은 사용자 피드백과 FactScore 같은 평가 방식으로 검증한다.
디노티시아는 이번 프로젝트에서 멀티모달 벡터 검색 기술과 함께 벡터 데이터 처리 가속 반도체인 VDPU도 검토하고 있다. 대규모 영상 아카이브에서는 검색 정확도만큼이나 대용량 데이터를 얼마나 빠르게 처리하느냐가 중요하기 때문이다. VDPU는 벡터 연산을 하드웨어 차원에서 가속해 대량 영상 데이터 처리 속도와 대역폭 효율을 높이는 방향으로 활용 가능성이 검토되고 있다.
SBS는 실제 방송 아카이브를 기반으로 자체 AI 검색 시스템을 구축하고 이를 현업 제작 환경에서 시험하고 있다. 뉴스, 시사, 교양 등 여러 장르의 콘텐츠를 대상으로 검색 정확도와 응답 속도, 활용 편의성을 종합적으로 점검하면서 제작과 편집, 아카이브 관리 등 실무 적용 범위를 구체화하는 단계다. 여기에 인물 중심 검색 수요를 반영해 자체 개발한 AI 얼굴 검색 기술도 순차적으로 적용하고 있다. 이를 통해 특정 인물의 출연 장면을 더 빠르게 찾고, 장기간 축적된 영상 자료에서 인물 단위 탐색 효율을 높이는 방안도 함께 모색하고 있다.
이번 협업은 디노티시아의 AI·반도체 기반 데이터 인프라 기술과 SBS의 방송 현장 운영 경험, 자체 AI 기술을 결합한 사례라는 점에서 의미가 있다. 양사는 이를 바탕으로 생성형 AI 시대에 방송 아카이브를 보다 적극적으로 활용할 수 있는 기술적·운영적 기준을 정교화해 나간다는 계획이다.
이재영 SBS CTO는 “방송사가 축적해 온 아카이브가 중요한 자산인 만큼, 앞으로는 이를 얼마나 빠르게 찾고 실제 제작 환경에서 활용할 수 있는지가 더 중요해질 것”이라며 “이번 실증이 기존 시스템을 유지하면서도 대규모 데이터 환경에서 AI 기반 검색과 활용 가능성을 점검하는 과정이 될 것”이라고 설명했다.
정무경 디노티시아 대표는 “현재 AI 발전이 언어모델 중심으로 이뤄지고 있지만, 앞으로 멀티모달 환경이 본격화하면 AI가 다뤄야 할 데이터의 양과 종류가 훨씬 커질 것”이라며 “앞으로는 모델 자체보다 대규모 데이터를 얼마나 빠르게 검색하고 실제 활용으로 이어지게 하느냐가 더 중요한 경쟁력이 될 것”이라고 말했다.
한편 이번 프로젝트는 과학기술정보통신부와 정보통신기획평가원(IITP)이 주관하는 ‘SW컴퓨팅산업원천기술개발’ 사업의 일환으로 추진 중인 ‘초거대 AI 모델의 장기 기억 저장을 위한 벡터 DB 개발’ 과제를 기반으로 진행되고 있다.
디노티시아는 앞서 한국지능정보사회진흥원(NIA)의 ‘2024년 초거대AI 확산 생태계 조성사업’에서도 한국 방송 영상 기반 멀티모달 데이터셋을 구축했고, 관련 연구 결과를 ACM Multimedia 2025에서 발표한 바 있다. 연구 단계에서 쌓아온 데이터 자산이 실제 방송 현장 적용으로 이어지면서, 방송 콘텐츠의 AI 자산화가 한층 구체적인 단계로 들어가고 있다는 평가가 나온다.