무하유, 국회도서관 융복합서비스 데이터셋 구축사업 '성공적'

자연어를 이해 실용 AI 기업을 표방하는 무하유는 '국회도서관 융복합서비스 데이터셋 구축 사업'을 성공적으로 완료했다고 15일 밝혔다.

무하유에 따르면 이번 사업을 통해 국회도서관에서 제공 중인 AI 의정분석 서비스 '아르고스'에 법률 관련 Q&A 데이터셋을 구축했고, 이를 통해 국회 및 공공 관련 법규 등 법률 관련 질의사항에 대화형 문답으로 쉽게 설명함으로써 이용자의 편의성을 높였다.

무하유는 원활한 사업 추진을 위해 법률 지식을 보유한 전문가들을 포함한 데이터셋 구축인력을 구성했다. 이는 법률에 관련 이슈 키워드와 제개정일·의안·회의록·주요 사건 및 인물에 대한 정보는 물론, 통계 표의 제목 및 매칭 키워드 등 광범위한 영역을 포함하는 성공적인 고품질 데이터셋 구축으로 이어졌다. 

그 외에 무하유는 HWP와 PDF 파일 내 법률 관련 통계 표 또는 이미지의 제목 및 매칭 키워드 데이터도 구축해 국회도서관의 콘텐츠 품질을 강화했다. 표 및 이미지 데이터 구축은 무하유의 표절검사 서비스 내에 적용된 이미지 인식 및 추출 기술을 활용해 자동으로 해당 데이터를 추출한 후, 다차원의 품질 검수를 실시하는 식으로 이뤄졌다.

한편 무하유는 700만건 이상의 AI 학습 데이터를 구축해 온 노하우를 토대로 데이터 관리 올인원 플랫폼인 ‘데이터 팩토리(이하 DF)’를 활용해 데이터셋 구축에 효율을 높였다. DF는 AI 적용 솔루션을 운영하는 과정에서 필요한 데이터를 자체적으로 구축한 후 정제 및 가공하기 때문에 인력소싱, 계약, 데이터 구축, 품질관리, 저작권 관리까지 가능하다는 장점이 있다.

무하유는 2011년 국내 최초 AI 기반 표절검사 서비스인 '카피킬러'를 선보인 후, 3500여개 고객사에 서비스를 제공하고 있다. 카피킬러는 무하유만의 고도화된 NLU(Natural Language Understanding, 자연어이해) 기술에 기반한 서비스로, 국내외 논문·법률·실시간 콘텐츠 등 다양한 텍스트 기반 데이터를 수집, 정제, 처리하고 있다.

신동호 무하유 대표는 "무하유는 기술로 공정의 효율화를 높이고, 인력으로 데이터의 품질을 높이는 방식의 데이터셋 구축 전략을 취하고 있다”며 “앞으로 검증된 AI 기술에 기반한 데이터셋 제작 역량으로 공공 분야 진출에 박차를 가할 것"이라고 밝혔다.

김광우 기자

kimnoba@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

시프트다이나믹스, 자율 무기체계 통합 솔루션 ‘SAGE AI’ 공개

방산 딥테크기업 시프트다이나믹스(Shift Dynamics Inc.)는 AI기술들을 활용, 무기체계의 성능을 혁신적 수준으로 끌어올릴 신개념 무기체계 AI 통합 솔루션을 선보인다고 2일 밝혔다....

태블로, 생성형 AI 접목한 ‘태블로 펄스’ 및 ‘태블로 코파일럿' 공개

AI CRM 솔루션 기업 세일즈포스는 지능형 데이터 분석 플랫폼 태블로(Tableau)가 미국 샌디에이고에서 개최한 연례 글로벌 컨퍼런스 ‘태블로 컨퍼런스 2024’에서 새로운...

레인보우로보틱스, 로봇이 로봇을 제조하는 최첨단 생산 공장과 신사옥 건설 본격화

로봇 플랫폼 전문기업 레인보우로보틱스는 세종시 집현동 세종테크밸리에 로봇이 로봇을 제조하는 최첨단 생산 공장 및 신사옥을 오는 2025년까지 건설한다고 2일 밝혔다....

[인터뷰] 김민성 아드리엘 부대표 “글로벌 디지털 마케팅 시장에서 경쟁력 있는 한국의 B2B SaaS 솔루션으로 인정받게 할 겁니다”

글로벌 시장 확대를 본격화하고 있는 아드리엘의 행보가 예사롭지 않다. 이러한 상황에서 지난달 김민성 부대표의 합류는 아드리엘의 글로벌 시장 공략에 새로운 전환점이 될 것으로 기대를 모으고 있다. 취임의 변을 통해 김 부대표는 아드리엘을 “글로벌 마케팅 분석 및 시각과 솔루션 이상의 가치를 제공하는 최고의 SaaS 기업이 될 수 있도록 할 것”이라고 포부를 밝혔다. 서울 종로구 아드리엘 본사에서 진행된 김 부대표와의 인터뷰는 이와 관련된 질문으로 시작했다.