문서 AI 경쟁서 존재감 키운 한국딥러닝… 글로벌 OCR 평가서 선두 올라

허깅페이스 등재 OCRBench v2 영어 부문서 68.1점 기록
문서 구조 이해·맥락 해석 강점… 제미나이·GPT보다 높은 성적
금융·법무·공공 등 고신뢰 문서 처리 시장 공략에 속도

문서 인공지능(AI) 분야에서 국내 기업 한국딥러닝이 글로벌 벤치마크 평가 상위권을 넘어 선두에 이름을 올렸다.

한국딥러닝은 허깅페이스에 공식 등재된 멀티모달 OCR 벤치마크 ‘OCRBench v2’의 2026년 3월 영어 부문 평가에서 종합 점수 68.1점을 기록하며 1위를 차지했다고 22일 밝혔다. 회사 측은 이번 결과가 아시아 기업으로는 처음으로 구글 제미나이를 제치고 해당 평가 정상에 오른 사례라고 설명했다.

이번에 성과를 낸 모델은 한국딥러닝의 문서 특화 시각언어모델(VLM) ‘KDL 프론티어’다. 이 모델은 대규모 문서 도메인 학습 데이터를 기반으로 개발됐으며, 문서 인식과 정보 추출 정확도를 높이는 데 초점을 맞췄다. 특히 외부에 공개되지 않은 프라이빗 데이터 환경에서도 성능이 유지되는 점을 확인했다고 회사는 밝혔다.

OCRBench v2는 단순 문자 인식을 넘어 레이아웃 분석, 수식과 도표 해석, 논리 추론 등 31개 시나리오를 평가하는 대규모 벤치마크다. 한국딥러닝에 따르면 이 평가는 사람이 직접 검증한 1만 건의 데이터셋과 별도 비공개 테스트셋을 함께 활용하는 방식으로 설계돼, 실제 성능 검증 강도가 높은 편에 속한다. 이런 평가에서 한국딥러닝은 2위 모델인 제미나이 3 프로 프리뷰와 4.7점 차이를 기록했고, 오픈AI GPT-5, 알리바바 큐원(Qwen) 계열, 앤트로픽 클로드 계열 모델보다도 높은 점수를 얻었다.

세부 항목 가운데서는 문서 구조화와 맥락 이해 능력이 두드러졌다는 것이 회사 측 설명이다. 한국딥러닝은 범용 멀티모달 모델이 문서 내 정보를 폭넓게 처리하는 데 초점을 맞추는 반면, 자사 모델은 문서 구조와 항목 간 관계, 위치 정보를 함께 반영하도록 설계했다고 밝혔다. 이를 통해 문서 안의 텍스트를 단순히 읽어내는 수준을 넘어, 실제 문맥에 맞는 정보 추출과 관계 이해 정확도를 높였다는 주장이다.

회사가 특히 강조한 대목은 환각 억제다. 생성형 AI 기반 모델은 존재하지 않는 정보를 만들어내는 환각 문제가 활용 단계에서 반복적으로 제기돼 왔는데, 한국딥러닝은 이를 최소화하는 ‘니어-제로 할루시네이션(Near-Zero Hallucination)’ 기술을 이번 성과의 핵심 배경으로 제시했다. 문서에 기재된 값을 가능한 한 그대로 추출하도록 설계해, 의미 왜곡 가능성을 낮추는 방향으로 모델을 고도화했다는 설명이다. 이는 금융, 법무, 공공처럼 수치나 문구의 작은 오류도 실제 업무 리스크로 이어질 수 있는 영역에서 특히 중요하게 작용할 수 있다.

실제 현장 적용 가능성도 이번 발표의 주요 메시지다. 한국딥러닝은 한국어 손글씨처럼 노이즈가 많은 입력 환경에서도 안정적인 인식이 가능하도록 최적화했으며, 다양한 문서 유형을 처리할 수 있도록 도메인 중심 전략을 적용했다고 밝혔다. 비공개 테스트셋 기반 평가에서도 성능이 유지된 점을 근거로 실제 비즈니스 환경에서의 활용성을 입증했다고 덧붙였다.

김동현 한국딥러닝 CSO는 “글로벌 빅테크들이 주도하는 AI 시장에서 아시아 기업이 국내 기술만으로 제미나이와 GPT를 넘어섰다는 점은 의미가 있다”며 “범용 모델이 따라오기 어려운 문서 지능 영역에서 구조적 설계의 차이를 입증한 결과”라고 밝혔다. 이어 “금융·법무·공공처럼 높은 정확성이 요구되는 산업 현장에서 환각 없는 문서 AI의 가치를 글로벌 시장에서 보여주겠다”고 말했다.

한편 2019년 설립된 한국딥러닝은 공공·기업용 시각지능 AI 솔루션을 공급하는 기업이다. 초거대 시각 인공지능 모델 ‘DEEP Agent’를 자체 개발해 운영하고 있으며, OCR, 객체 검출, 영상 이해, 이미지 생성 등 다양한 비전 AI 기술을 80곳 이상의 공공·기업 고객에게 제공하고 있다.

김광우 기자

kimnoba@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

경기도 마을버스에 AI 안전운전 관리체계 도입 추진

에이아이매틱스, 경기도마을버스운송사업조합·고양시 지부와 3자 협약 체결 실시간 위험 감지와 운전자별 데이터 분석 기반 안전관리 체계 구축 나서 경기도 거점으로 공공교통...

“돌봄 공백 메우는 AI 통화”… 케어링, 일레븐랩스 손잡고 시니어케어 확장

시니어케어 전문기업 케어링은 최근 일레븐랩스(ElevenLabs)의 에이전트 플랫폼(Agents Platform)을 도입해 ‘AI 마음돌봄’ 서비스를 확장하고 있다고 21일 밝혔다.

“검색창에 문장으로 말하면 상품이 뜬다”… 플래티어, ‘젤라또’로 한·일 공략

플래티어는 21일 에이전틱 디스커버리 플랫폼 ‘젤라또(gelatto)’를 양국에 동시 출시하고, B2C AI 탐색 시장 공략에 나선다고 밝혔다.

팀 쿡, 15년 만에 CEO 자리 내놓는다…애플 역사상 가장 조용했던 권력 이양의 진실

애플이 2026년 4월 20일, 팀 쿡이 오는 9월 1일부로 CEO직에서 물러난다고 공식 발표했다. 2011년 스티브 잡스의 뒤를 이어 15년간 애플을 이끌어온 팀 쿡은 이사회 회장으로 물러나고, 현 하드웨어 엔지니어링 수석 부사장 존 터너스가 신임 CEO로 취임한다.