
문서 인공지능(AI) 분야에서 국내 기업 한국딥러닝이 글로벌 벤치마크 평가 상위권을 넘어 선두에 이름을 올렸다.
한국딥러닝은 허깅페이스에 공식 등재된 멀티모달 OCR 벤치마크 ‘OCRBench v2’의 2026년 3월 영어 부문 평가에서 종합 점수 68.1점을 기록하며 1위를 차지했다고 22일 밝혔다. 회사 측은 이번 결과가 아시아 기업으로는 처음으로 구글 제미나이를 제치고 해당 평가 정상에 오른 사례라고 설명했다.
이번에 성과를 낸 모델은 한국딥러닝의 문서 특화 시각언어모델(VLM) ‘KDL 프론티어’다. 이 모델은 대규모 문서 도메인 학습 데이터를 기반으로 개발됐으며, 문서 인식과 정보 추출 정확도를 높이는 데 초점을 맞췄다. 특히 외부에 공개되지 않은 프라이빗 데이터 환경에서도 성능이 유지되는 점을 확인했다고 회사는 밝혔다.
OCRBench v2는 단순 문자 인식을 넘어 레이아웃 분석, 수식과 도표 해석, 논리 추론 등 31개 시나리오를 평가하는 대규모 벤치마크다. 한국딥러닝에 따르면 이 평가는 사람이 직접 검증한 1만 건의 데이터셋과 별도 비공개 테스트셋을 함께 활용하는 방식으로 설계돼, 실제 성능 검증 강도가 높은 편에 속한다. 이런 평가에서 한국딥러닝은 2위 모델인 제미나이 3 프로 프리뷰와 4.7점 차이를 기록했고, 오픈AI GPT-5, 알리바바 큐원(Qwen) 계열, 앤트로픽 클로드 계열 모델보다도 높은 점수를 얻었다.
세부 항목 가운데서는 문서 구조화와 맥락 이해 능력이 두드러졌다는 것이 회사 측 설명이다. 한국딥러닝은 범용 멀티모달 모델이 문서 내 정보를 폭넓게 처리하는 데 초점을 맞추는 반면, 자사 모델은 문서 구조와 항목 간 관계, 위치 정보를 함께 반영하도록 설계했다고 밝혔다. 이를 통해 문서 안의 텍스트를 단순히 읽어내는 수준을 넘어, 실제 문맥에 맞는 정보 추출과 관계 이해 정확도를 높였다는 주장이다.
회사가 특히 강조한 대목은 환각 억제다. 생성형 AI 기반 모델은 존재하지 않는 정보를 만들어내는 환각 문제가 활용 단계에서 반복적으로 제기돼 왔는데, 한국딥러닝은 이를 최소화하는 ‘니어-제로 할루시네이션(Near-Zero Hallucination)’ 기술을 이번 성과의 핵심 배경으로 제시했다. 문서에 기재된 값을 가능한 한 그대로 추출하도록 설계해, 의미 왜곡 가능성을 낮추는 방향으로 모델을 고도화했다는 설명이다. 이는 금융, 법무, 공공처럼 수치나 문구의 작은 오류도 실제 업무 리스크로 이어질 수 있는 영역에서 특히 중요하게 작용할 수 있다.
실제 현장 적용 가능성도 이번 발표의 주요 메시지다. 한국딥러닝은 한국어 손글씨처럼 노이즈가 많은 입력 환경에서도 안정적인 인식이 가능하도록 최적화했으며, 다양한 문서 유형을 처리할 수 있도록 도메인 중심 전략을 적용했다고 밝혔다. 비공개 테스트셋 기반 평가에서도 성능이 유지된 점을 근거로 실제 비즈니스 환경에서의 활용성을 입증했다고 덧붙였다.
김동현 한국딥러닝 CSO는 “글로벌 빅테크들이 주도하는 AI 시장에서 아시아 기업이 국내 기술만으로 제미나이와 GPT를 넘어섰다는 점은 의미가 있다”며 “범용 모델이 따라오기 어려운 문서 지능 영역에서 구조적 설계의 차이를 입증한 결과”라고 밝혔다. 이어 “금융·법무·공공처럼 높은 정확성이 요구되는 산업 현장에서 환각 없는 문서 AI의 가치를 글로벌 시장에서 보여주겠다”고 말했다.
한편 2019년 설립된 한국딥러닝은 공공·기업용 시각지능 AI 솔루션을 공급하는 기업이다. 초거대 시각 인공지능 모델 ‘DEEP Agent’를 자체 개발해 운영하고 있으며, OCR, 객체 검출, 영상 이해, 이미지 생성 등 다양한 비전 AI 기술을 80곳 이상의 공공·기업 고객에게 제공하고 있다.
