사이냅소프트, VLM과 AI 에이전트 결합, ‘에이전틱 OCR’ 시대 열었다

VLM·KVT·FormMaker 결합한 'Agentic OCR' 방식 채택으로 도입 및 운영 효율성 극대화
TTA 한글 인식률 99.3% 유지하며 비정형 문서 대응력과 환각 방지 기술 동시 확보
도큐먼트 AI 전문기업 사이냅소프트는 시각 언어 모델(VLM)과 AI 에이전트 기술을 결합한 '사이냅 OCR IX'를 출시한다.

도큐먼트 AI 전문기업 사이냅소프트는 시각 언어 모델(VLM)과 AI 에이전트 기술을 결합한 '사이냅 OCR IX'를 출시한다고 26일 밝혔다.

사이냅소프트는 이번 ‘사이냅 OCR IX’ 출시를 통해 기존의 정형 서식 위주 OCR 시장을 넘어, 고도의 문맥 이해가 필요한 비정형 비즈니스 문서 시장에서의 인공지능 전환(AX)을 본격적으로 주도한다는 계획이다.

사이냅 OCR IX의 핵심은 AI 에이전트가 문서의 유형과 처리량에 따라 VLM, KVT(Key Value Trainer), FormMaker 중 최적의 엔진을 자동으로 선택하는 'Agentic OCR' 솔루션이다. 기존 사이냅 OCR의 TTA 인증 99.3% 한글 인식률을 유지하면서 새롭게 결합된 세 가지 엔진이 상호 보완하며 운영 효율을 극대화한다.

사이냅 OCR IX에 새로 결합된 VLM은 사전 학습 없이 신규 양식을 바로 처리할 수 있어 도입 기간을 단축하고, 비정형 문서에서도 맥락을 파악해 데이터를 정확히 추출한다. 기존 사이냅 OCR의 텍스트 인식 기술과 결합해 VLM만 사용했을 때의 환각 현상을 방지하고 오인식을 최소화한 것이 특징이다.

데이터가 축적되면 KVT로 전환해 처리 속도를 높이고 운영 비용을 절감할 수 있으며, 주민등록증이나 운전면허증 같은 표준 서식은 FormMaker로 초고속 처리가 가능하다.

사이냅 OCR IX는 세금계산서, 거래명세서, 견적서 등 비정형 비즈니스 문서부터 표준 서식까지 폭넓게 적용할 수 있는 실질적인 솔루션을 완성했다.

사이냅소프트 전경헌 대표는 "OCR IX는 25년간 축적한 문서 처리 기술에 AI 에이전트 개념을 결합해 도입부터 운영까지 최적의 성능을 제공하는 솔루션"이라며 "200건 이상의 실적으로 입증된 인식 정확도에 VLM의 유연성을 더해, 도입부터 확장까지 기업의 업무 환경에 가장 최적화된 도큐먼트 AI 모델을 구현했다”고 전했다.

김한수 기자

hanskim@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

채용 공고부터 추천까지 한 번에…AI로 묶은 ‘통합 채용 허브’ 등장

잡코리아가 AI 기반 통합 채용 솔루션 ‘하이어링 센터’를 공개했다. 채용 공고 등록부터 지원자 관리, 커뮤니케이션, 운영 관리까지 전 과정을 하나의 환경에서 처리할 수 있도록 설계된 것이 핵심이다.

정답 아닌 과정 본다…AI 활용 역량, 다면 분석으로 판별

‘AI 역량평가’는 응시자가 AI를 활용해 결과를 도출하는 과정 자체를 분석한다. 프롬프트를 설계하고, AI의 응답을 검증한 뒤 이를 보완해 최종 성과로 연결하는 일련의 단계가 평가 대상이다. 단순 정답 여부가 아니라 활용 과정의 완성도를 데이터 기반으로 측정한다는 점에서 기존 평가와 차별화된다.

마이크로소프트, AI 한 명 시대 접고 ‘집단 검토’로 간다… 코파일럿 리서처에 GPT·클로드 동시 투입

마이크로소프트가 자사 업무용 AI 서비스인 마이크로소프트 365 코파일럿의 심화 조사 도구 ‘리서처’에 복수의 대형언어모델(LLM)을 함께 활용하는 구조를 도입했다.

QAI-LG전자 등 4사 맞손… ‘양자·AI 결합 데이터센터’ 시장 선점 나선다

AI 연산 폭증 속 전력·효율 한계 대응… 차세대 인프라 협력 본격화 하이브리드 퀀텀 엣지 데이터센터 공동 구축… 역할 분담 기반...