사이냅소프트, VLM과 AI 에이전트 결합, ‘에이전틱 OCR’ 시대 열었다

VLM·KVT·FormMaker 결합한 'Agentic OCR' 방식 채택으로 도입 및 운영 효율성 극대화
TTA 한글 인식률 99.3% 유지하며 비정형 문서 대응력과 환각 방지 기술 동시 확보
도큐먼트 AI 전문기업 사이냅소프트는 시각 언어 모델(VLM)과 AI 에이전트 기술을 결합한 '사이냅 OCR IX'를 출시한다.

도큐먼트 AI 전문기업 사이냅소프트는 시각 언어 모델(VLM)과 AI 에이전트 기술을 결합한 '사이냅 OCR IX'를 출시한다고 26일 밝혔다.

사이냅소프트는 이번 ‘사이냅 OCR IX’ 출시를 통해 기존의 정형 서식 위주 OCR 시장을 넘어, 고도의 문맥 이해가 필요한 비정형 비즈니스 문서 시장에서의 인공지능 전환(AX)을 본격적으로 주도한다는 계획이다.

사이냅 OCR IX의 핵심은 AI 에이전트가 문서의 유형과 처리량에 따라 VLM, KVT(Key Value Trainer), FormMaker 중 최적의 엔진을 자동으로 선택하는 'Agentic OCR' 솔루션이다. 기존 사이냅 OCR의 TTA 인증 99.3% 한글 인식률을 유지하면서 새롭게 결합된 세 가지 엔진이 상호 보완하며 운영 효율을 극대화한다.

사이냅 OCR IX에 새로 결합된 VLM은 사전 학습 없이 신규 양식을 바로 처리할 수 있어 도입 기간을 단축하고, 비정형 문서에서도 맥락을 파악해 데이터를 정확히 추출한다. 기존 사이냅 OCR의 텍스트 인식 기술과 결합해 VLM만 사용했을 때의 환각 현상을 방지하고 오인식을 최소화한 것이 특징이다.

데이터가 축적되면 KVT로 전환해 처리 속도를 높이고 운영 비용을 절감할 수 있으며, 주민등록증이나 운전면허증 같은 표준 서식은 FormMaker로 초고속 처리가 가능하다.

사이냅 OCR IX는 세금계산서, 거래명세서, 견적서 등 비정형 비즈니스 문서부터 표준 서식까지 폭넓게 적용할 수 있는 실질적인 솔루션을 완성했다.

사이냅소프트 전경헌 대표는 "OCR IX는 25년간 축적한 문서 처리 기술에 AI 에이전트 개념을 결합해 도입부터 운영까지 최적의 성능을 제공하는 솔루션"이라며 "200건 이상의 실적으로 입증된 인식 정확도에 VLM의 유연성을 더해, 도입부터 확장까지 기업의 업무 환경에 가장 최적화된 도큐먼트 AI 모델을 구현했다”고 전했다.

김한수 기자

hanskim@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

“여행 경비도 외화로 바로 정산”…트래블월렛 친구간송금 600만건 넘었다

트래블월렛은 ‘친구간송금’ 서비스가 출시 1년 8개월 만에 누적 이용 건수 600만 건을 넘어섰다고 15일 밝혔다. 누적 이용자 수는 200만 명을 기록했다.

전기차 보조금, 판매 실적보다 공급망·안전이 먼저...테슬라·BYD도 심사대 오른다

전기차 보조금 기준이 7월부터 달라진다. 공급망·안전관리 등 5개 분야 13개 항목 평가에서 60점 이상을 받아야 보급사업 참여 가능. 테슬라는 통과 유력, BYD는 공급망 항목이 변수.

“코딩 몰라도 금융 AI 실무 경험”…PFCT, AI 신용평가 아카데미 4기 모집

AI 금융기술 기업 피에프씨테크놀로지스(PFCT)는 금융 AI 실무 인재 양성을 위한 ‘제4회 PFCT AI 신용평가 아카데미’ 참가자를 모집한다고 13일 밝혔다. 모집 기간은 이날부터 31일까지다. 참가 대상은 AI 금융기술에 관심 있는 대학생, 대학원생 및 졸업생이며 참가비는 전액 무료다.

AI가 상품 찾고 결제까지…플래티어, ‘에이전틱 커머스’ AX 백서 발간

AI가 고객 대신 상품을 탐색하고 비교한 뒤 결제까지 수행하는 커머스 환경이 현실화되면서, 이커머스 기업의 경쟁 전략도 기능 단위의 AI 도입을 넘어 전사적 AI 전환으로 이동하고 있다. 단순 추천 알고리즘이나 챗봇 적용만으로는 변화 속도를 따라가기 어려워졌고, 기업 운영 구조 자체를 AI 중심으로 재편해야 한다는 요구가 커지고 있다.