TEXTNET, 고품질 사전 구축 학습 데이터 구매 가능한 ‘Data Market’ 오픈

인공지능(AI) 학습 데이터 구축 서비스 ‘TEXTNET’의 운영사 스피링크는 언어모델 학습을 위한 사전 구축 데이터를 판매하는 ‘Data Market’을 오픈했다고 21일 밝혔다.

스피링크에 따르면 ‘Data Market’은 고객이 필요한 학습 데이터를 빠르게 확보할 수 있도록 마련된 서비스로, 준비된 데이터 샘플을 확인한 후 즉시 구매하여 학습에 활용할 수 있도록 돕는다. 이를 통해 고객은 데이터 구축 업체 선정, 데이터 명세 협의 등 복잡한 과정 없이 충분한 기획/작업기간과 꼼꼼한 검수, 개선 과정을 거친 사전 구축 데이터를 신속하게 수급할 수 있다.

스피링크 측은 “고객은 ‘Data Market’에서 판매 중인 데이터 리스트를 통해 데이터의 세부 정보를 확인하고 적합한 데이터 샘플을 요청하여 구매 결정을 내릴 수 있다”며 “사전 구축 데이터를 학습 목적과 자사의 모델에 맞게 일부 수정하는 것도 가능하다”고 설명했다.

TEXTNET의 ‘Data Market’은 공식 홈페이지를 통해 접속할 수 있다. 국내 최대 자연어처리 학회(HCLT 2023) 우수논문의 실증 데이터인 ‘성향별 청자의 공감 반응 패턴 데이터’ 등 다양한 자연어 학습 데이터가 지속 업데이트 될 예정이다.

더불어 스피링크는 ‘Data Market’ 오픈을 기념해 데이터 수요 조사에 참여한 고객에게는 실제 데이터 구축 시 30% 할인된 가격으로 데이터를 우선 공급 받을 수 있는 얼리 액세스 혜택도 제공한다.

고경민 스피링크 대표는 “인공지능 기술이 발전할수록 경쟁사보다 빠르게 고품질 데이터를 확보하려는 경쟁이 격화될 것”이라며 “다년간의 데이터 설계 및 구축 노하우를 담아 꼼꼼하게 구축한 데이터를 적시에 제공해 고객들이 골든타임을 놓치지 않도록 최선을 다할 것”이라고 말했다.

한편 스피링크는 TEXTNET를 통해 최근 KT, NC 등 자체 언어모델을 개발하고 있는 기업들의 학습 데이터 구축 프로젝트를 수주, 성공적으로 수행하며 데이터 설계 및 구축 전문성을 입증했다.

김광우 기자

kimnoba@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

포티투마루, 오라클과 생성 AI 기반 LLM 클라우드 사업 협력

생성형 AI 스타트업 포티투마루(42Maru)가 글로벌 데이터베이스 기업 오라클(Oracle)과 '생성 AI 기반 경량화 LLM 클라우드 사업' 협력을 진행한다고 12일 밝혔다. 이번...

호패, 가트너 보고서에 분산신원인증(DID) 분야 글로벌 대표 기업으로 등재

디지털 신원인증 솔루션 기업 호패는 2024 가트너 분산신원 증명 시장 가이드(2024 Gartner Market Guide for Decentralized Identity) 에서 대표 공급...

무하유, 수도권 주요 특목고에 'GPT킬러' 공급

자연어 이해 실용 AI 기업 무하유는 여러 특목고에 GPT킬러를 공급했다고 11일 밝혔다. 이번 GPT킬러를 공급한 특목고는 고양국제고등학교, 미추홀외국어고등학교, 서울과학고등학교, 인천과학예술영재학교,...

엘리스그룹, 초∙중등 국어 AI 디지털교과서 프로토타입 개발

AI 교육 솔루션 기업 엘리스그룹은 한국교육학술정보원(KERIS)의 ‘AI 디지털교과서 서비스 모델 및 프로토타입 개발 연구’ 사업의 초등∙중등 국어 과목 개발사로 선정됐다고...