무하유, 국회도서관 융복합서비스 데이터셋 구축사업 '성공적'

자연어를 이해 실용 AI 기업을 표방하는 무하유는 '국회도서관 융복합서비스 데이터셋 구축 사업'을 성공적으로 완료했다고 15일 밝혔다.

무하유에 따르면 이번 사업을 통해 국회도서관에서 제공 중인 AI 의정분석 서비스 '아르고스'에 법률 관련 Q&A 데이터셋을 구축했고, 이를 통해 국회 및 공공 관련 법규 등 법률 관련 질의사항에 대화형 문답으로 쉽게 설명함으로써 이용자의 편의성을 높였다.

무하유는 원활한 사업 추진을 위해 법률 지식을 보유한 전문가들을 포함한 데이터셋 구축인력을 구성했다. 이는 법률에 관련 이슈 키워드와 제개정일·의안·회의록·주요 사건 및 인물에 대한 정보는 물론, 통계 표의 제목 및 매칭 키워드 등 광범위한 영역을 포함하는 성공적인 고품질 데이터셋 구축으로 이어졌다. 

그 외에 무하유는 HWP와 PDF 파일 내 법률 관련 통계 표 또는 이미지의 제목 및 매칭 키워드 데이터도 구축해 국회도서관의 콘텐츠 품질을 강화했다. 표 및 이미지 데이터 구축은 무하유의 표절검사 서비스 내에 적용된 이미지 인식 및 추출 기술을 활용해 자동으로 해당 데이터를 추출한 후, 다차원의 품질 검수를 실시하는 식으로 이뤄졌다.

한편 무하유는 700만건 이상의 AI 학습 데이터를 구축해 온 노하우를 토대로 데이터 관리 올인원 플랫폼인 ‘데이터 팩토리(이하 DF)’를 활용해 데이터셋 구축에 효율을 높였다. DF는 AI 적용 솔루션을 운영하는 과정에서 필요한 데이터를 자체적으로 구축한 후 정제 및 가공하기 때문에 인력소싱, 계약, 데이터 구축, 품질관리, 저작권 관리까지 가능하다는 장점이 있다.

무하유는 2011년 국내 최초 AI 기반 표절검사 서비스인 '카피킬러'를 선보인 후, 3500여개 고객사에 서비스를 제공하고 있다. 카피킬러는 무하유만의 고도화된 NLU(Natural Language Understanding, 자연어이해) 기술에 기반한 서비스로, 국내외 논문·법률·실시간 콘텐츠 등 다양한 텍스트 기반 데이터를 수집, 정제, 처리하고 있다.

신동호 무하유 대표는 "무하유는 기술로 공정의 효율화를 높이고, 인력으로 데이터의 품질을 높이는 방식의 데이터셋 구축 전략을 취하고 있다”며 “앞으로 검증된 AI 기술에 기반한 데이터셋 제작 역량으로 공공 분야 진출에 박차를 가할 것"이라고 밝혔다.

김광우 기자

kimnoba@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

[스타트업 안테나] 에이비일팔공 214억 투자·라이드플럭스 로보트럭 상용화·혁신의숲 Pathfinder 출시

1일 스타트업·스케일업 업계에서 투자 유치와 자율주행 물류 상용화, AI 데이터 서비스 출시, 창업 지원 네트워킹, 헬스뷰티 사업 확장 소식이 이어지고 있다. 에이비일팔공은 214억 원 규모 시리즈C 투자를 유치하며 AI 마케팅 플랫폼 고도화와 글로벌 확장에 나섰고, 라이드플럭스는 한진과 국내 첫 자율주행트럭 유상 화물 운송을 시작하며 미들마일 물류 시장 공략을 본격화했다. 혁신의숲을 운영하는 마크앤컴퍼니는 글로벌 상위 투자사의 초기 투자 흐름을 분석하는 투자 인텔리전스 서비스 ‘Pathfinder’를 출시했다. 파일러는 월드컵 기간 유튜브 영상 데이터를 분석해 AI 제작 콘텐츠와 허위정보 확산 흐름을 짚었으며, 씨엔티테크는 경기북부 청년창업사관학교 입교생과 졸업 기업을 잇는 비즈매칭데이를 열었다. 지앤바이오솔루션은 저속노화와 롱제비티를 앞세운 헬스뷰티 융합솔루션 기업으로의 성장 비전을 제시했다.

[현장] “한국이 아니라 한국인에 투자하라”… UKF Korea, 서울에서 한인 창업자 연대의 판을 넓히다

(왼쪽 위부터 시계방향)정세주 UKF 공동의장(눔·Noom 창업자 겸 이사회 의장), 이기하 UKF 공동의장(사제파트너스 창업자), 김성훈 UKF Korea 대표(법무법인 미션 대표변호사), 김창원 UKF 전략이사(세이와이즈 창업자). UKF Korea는 서울 삼성동 코엑스(COEX)에서 ‘Seoul Meets UKF’를 열고, 한국 법인 출범과 함께 한국 창업 생태계와 글로벌 한인 창업자 네트워크를 본격적으로 연결하겠다는 비전을 밝혔다. (이미지=AI로 생성)

PFCT, 중금리 대출 부실 예측 AI 특허 등록…에어팩 기술 독창성 인정

AI 기술금융사 피에프씨테크놀로지스(PFCT)가 금융 특화 버티컬 AI 인프라 ‘에어팩(AIRPACK)’에 적용한 중금리 대출 부실 리스크 예측 기술로 특허를 등록했다. PFCT는 이번 특허 등록을 통해 에어팩의 핵심 기술 구현 방식과 독창성을 추가로 인정받았다고 30일 밝혔다.

[스타트업 안테나] 앰플리 시드 투자·오후두시랩 초격차 선정…그리팅 MCP·팀카이 열림·피처링 일본 확장

앰플리, 블루포인트에서 시드 투자 유치…일상 건강 진단 플랫폼 고도화 오후두시랩·팀카이, 정부·글로벌 협업 프로그램 선정…AI 탄소회계·상담 에이전트 확장 그리팅 MCP 연동...