카카오엔터프라이즈, 자체 AI모델로 한국어 기계독해 평가 1위 기록

카카오엔터프라이즈(이하 카카오)가 자체 개발한 자연어처리 AI 모델이 한국어 기계독해 데이터셋 ‘KorQuAD 2.0(The Korean Question Answering Dataset 2.0)’ 성능 평가에서 1위를 차지했다.

23일 카카오에 따르면 ‘KorQuAD 2.0’은 대규모 한국어 질의응답 데이터셋으로, 2018년 12월 'KorQuAD 1.0’이 오픈소스로 공개된 이후 현재 2.0은 리스트, 표 등이 포함된 HTML 문서의 이해, 길고 방대한 문서를 빠르게 처리하는 기술을 요구하며 한층 난이도가 올라간 상태다.

평가는 데이터셋에서 추출한 내용을 질문으로 제시하고, 이에 대해 AI 모델이 정확한 답을 찾아내는 방식으로 이루어진다.

카카오의 자연어처리 모델 'LittleBird-large’는 정확도 90.22점을 기록하며 1위에 올랐다. 정확도 뿐만 아니라 처리 속도 역시 기존 1위 모델 대비 약 1.7배 빠른 수치를 기록해 기술력을 입증했다.

또한 모델 사이즈를 최적화해 추론 속도를 높이고 실용성을 제고하도록 함께 개발된 ‘LittleBird-base’ 모델은 정확도 88.57점으로 6위를 기록하며, 유사 성능의 타사 모델 대비 약 3.4배 빠른 속도로 데이터를 처리하는 성과를 거두었다.

카카오는 해당 모델을 지속적으로 고도화해 검색, 챗봇을 비롯해 AI 컨택센터인 ‘카카오 i 커넥트 센터’에 적용할 예정이다. 예를 들어 ‘카카오 i 커넥트 센터’에 적용하면 AI 상담사가 해당 기계독해 모델을 적용한 지식 검색 시스템을 활용해 고객의 질의나 요청에 대해 한층 정확한 답변을 제공할 수 있게 된다.

카카오는 지난 2019년에도 자체 언어모델이 'KorQuAD 1.0’에서 1위에 오른 바 있다. 당시 카카오의 언어모델은 평가 주체인 인간의 문장 판별 및 독해 능력 수준(Human Performance)이라고 밝혀진 91.20점보다 0.65점 높은 91.85점을 받으며 AI가 인간보다 높은 점수를 기록한 최초의 사례로 기록됐다.

최동진 카카오엔터프라이즈 AI Lab & Service장은 “기계독해는 문서를 단순히 이해하는 것을 넘어 분석, 추론을 통해 최적화된 답을 제공하는 기술로, AI를 활용한 실서비스를 고도화하는데 직접적인 영향을 끼친다"며 “카카오엔터프라이즈는 앞으로 자연어처리는 물론 비전, 음성 등 다양한 영역에서 연구 역량을 강화해 나갈 것”이라고 밝혔다.

조인숙 기자

aloha@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

채용 공고부터 추천까지 한 번에…AI로 묶은 ‘통합 채용 허브’ 등장

잡코리아가 AI 기반 통합 채용 솔루션 ‘하이어링 센터’를 공개했다. 채용 공고 등록부터 지원자 관리, 커뮤니케이션, 운영 관리까지 전 과정을 하나의 환경에서 처리할 수 있도록 설계된 것이 핵심이다.

정답 아닌 과정 본다…AI 활용 역량, 다면 분석으로 판별

‘AI 역량평가’는 응시자가 AI를 활용해 결과를 도출하는 과정 자체를 분석한다. 프롬프트를 설계하고, AI의 응답을 검증한 뒤 이를 보완해 최종 성과로 연결하는 일련의 단계가 평가 대상이다. 단순 정답 여부가 아니라 활용 과정의 완성도를 데이터 기반으로 측정한다는 점에서 기존 평가와 차별화된다.

마이크로소프트, AI 한 명 시대 접고 ‘집단 검토’로 간다… 코파일럿 리서처에 GPT·클로드 동시 투입

마이크로소프트가 자사 업무용 AI 서비스인 마이크로소프트 365 코파일럿의 심화 조사 도구 ‘리서처’에 복수의 대형언어모델(LLM)을 함께 활용하는 구조를 도입했다.

QAI-LG전자 등 4사 맞손… ‘양자·AI 결합 데이터센터’ 시장 선점 나선다

AI 연산 폭증 속 전력·효율 한계 대응… 차세대 인프라 협력 본격화 하이브리드 퀀텀 엣지 데이터센터 공동 구축… 역할 분담 기반...