문서 AI 경쟁서 존재감 키운 한국딥러닝… 글로벌 OCR 평가서 선두 올라

비즈니스 테크놀로지

문서 AI 경쟁서 존재감 키운 한국딥러닝… 글로벌 OCR 평가서 선두 올라

김광우 기자

2026.04.22

가

허깅페이스 등재 OCRBench v2 영어 부문서 68.1점 기록

문서 구조 이해·맥락 해석 강점… 제미나이·GPT보다 높은 성적

금융·법무·공공 등 고신뢰 문서 처리 시장 공략에 속도

문서 인공지능(AI) 분야에서 국내 기업 한국딥러닝이 글로벌 벤치마크 평가 상위권을 넘어 선두에 이름을 올렸다.

한국딥러닝은 허깅페이스에 공식 등재된 멀티모달 OCR 벤치마크 ‘OCRBench v2’의 2026년 3월 영어 부문 평가에서 종합 점수 68.1점을 기록하며 1위를 차지했다고 22일 밝혔다. 회사 측은 이번 결과가 아시아 기업으로는 처음으로 구글 제미나이를 제치고 해당 평가 정상에 오른 사례라고 설명했다.

이번에 성과를 낸 모델은 한국딥러닝의 문서 특화 시각언어모델(VLM) ‘KDL 프론티어’다. 이 모델은 대규모 문서 도메인 학습 데이터를 기반으로 개발됐으며, 문서 인식과 정보 추출 정확도를 높이는 데 초점을 맞췄다. 특히 외부에 공개되지 않은 프라이빗 데이터 환경에서도 성능이 유지되는 점을 확인했다고 회사는 밝혔다.

OCRBench v2는 단순 문자 인식을 넘어 레이아웃 분석, 수식과 도표 해석, 논리 추론 등 31개 시나리오를 평가하는 대규모 벤치마크다. 한국딥러닝에 따르면 이 평가는 사람이 직접 검증한 1만 건의 데이터셋과 별도 비공개 테스트셋을 함께 활용하는 방식으로 설계돼, 실제 성능 검증 강도가 높은 편에 속한다. 이런 평가에서 한국딥러닝은 2위 모델인 제미나이 3 프로 프리뷰와 4.7점 차이를 기록했고, 오픈AI GPT-5, 알리바바 큐원(Qwen) 계열, 앤트로픽 클로드 계열 모델보다도 높은 점수를 얻었다.

세부 항목 가운데서는 문서 구조화와 맥락 이해 능력이 두드러졌다는 것이 회사 측 설명이다. 한국딥러닝은 범용 멀티모달 모델이 문서 내 정보를 폭넓게 처리하는 데 초점을 맞추는 반면, 자사 모델은 문서 구조와 항목 간 관계, 위치 정보를 함께 반영하도록 설계했다고 밝혔다. 이를 통해 문서 안의 텍스트를 단순히 읽어내는 수준을 넘어, 실제 문맥에 맞는 정보 추출과 관계 이해 정확도를 높였다는 주장이다.

회사가 특히 강조한 대목은 환각 억제다. 생성형 AI 기반 모델은 존재하지 않는 정보를 만들어내는 환각 문제가 활용 단계에서 반복적으로 제기돼 왔는데, 한국딥러닝은 이를 최소화하는 ‘니어-제로 할루시네이션(Near-Zero Hallucination)’ 기술을 이번 성과의 핵심 배경으로 제시했다. 문서에 기재된 값을 가능한 한 그대로 추출하도록 설계해, 의미 왜곡 가능성을 낮추는 방향으로 모델을 고도화했다는 설명이다. 이는 금융, 법무, 공공처럼 수치나 문구의 작은 오류도 실제 업무 리스크로 이어질 수 있는 영역에서 특히 중요하게 작용할 수 있다.

실제 현장 적용 가능성도 이번 발표의 주요 메시지다. 한국딥러닝은 한국어 손글씨처럼 노이즈가 많은 입력 환경에서도 안정적인 인식이 가능하도록 최적화했으며, 다양한 문서 유형을 처리할 수 있도록 도메인 중심 전략을 적용했다고 밝혔다. 비공개 테스트셋 기반 평가에서도 성능이 유지된 점을 근거로 실제 비즈니스 환경에서의 활용성을 입증했다고 덧붙였다.

김동현 한국딥러닝 CSO는 “글로벌 빅테크들이 주도하는 AI 시장에서 아시아 기업이 국내 기술만으로 제미나이와 GPT를 넘어섰다는 점은 의미가 있다”며 “범용 모델이 따라오기 어려운 문서 지능 영역에서 구조적 설계의 차이를 입증한 결과”라고 밝혔다. 이어 “금융·법무·공공처럼 높은 정확성이 요구되는 산업 현장에서 환각 없는 문서 AI의 가치를 글로벌 시장에서 보여주겠다”고 말했다.

한편 2019년 설립된 한국딥러닝은 공공·기업용 시각지능 AI 솔루션을 공급하는 기업이다. 초거대 시각 인공지능 모델 ‘DEEP Agent’를 자체 개발해 운영하고 있으며, OCR, 객체 검출, 영상 이해, 이미지 생성 등 다양한 비전 AI 기술을 80곳 이상의 공공·기업 고객에게 제공하고 있다.

#GPT #OCRBench v2 영어 부문 #문서 AI #제미나이 #허깅페이스

김광우 기자

kimnoba@tech42.co.kr

기자의 다른 기사보기

"AI 시대 경쟁력, 사용법이 아니라 사고력이다"

MIT 미디어랩의 '인지 부채' 뇌파 연구와 구글 딥마인드·앤트로픽의 철학자 채용 사례를 함께 짚었다. AI에 사고를 위탁할수록 뇌 활동은 둔해지지만, 노동시장 일각은 AI가 대신할 수 없는 인간의 비판적 사고력에 더 높은 값을 매기고 있다는 진단이다.

인사이트42 스타트업 인터뷰 테크놀로지

[현장] 위성과 AI가 재배 돕고 로봇이 수확·도축하고…‘AFPRO 2026’서 본 농업의 진화

농사를 짓다 궁금한 것이 생기면 인공지능(AI)에 묻고, 사람이 일일이 돌아보던 넓은 노지는 위성 데이터로 살핀다. AI가 크기와 형태가 제각각인 가축을 인식해 로봇이 도축 공정 일부를 수행하도록 하고, 수확과 예찰 같은 반복 농작업도 로봇으로 대체하려는 시도가 이어지고 있다. 생산된 농식품이 소비자에게 이동하는 물류 과정에서는 탄소 배출량을 데이터로 측정·관리하는 기술까지 등장했다. AI가 모니터 속 분석 도구를 넘어 농업 현장에서 직접 보고 판단하고 움직이는 단계로 확장되고 있는 셈이다.