카카오엔터프라이즈, 고객 맞춤형 AI 음성인식 서비스 ‘커스텀 STT’ 공개

지난해 11월 17일 온라인으로 진행된 if kakao 2021 컨퍼런스에서 최종진 카카오엔터프라이즈 AI Lab장은 자사 AI와 커스텀 STT 등의 개발 진행 사항을 설명한 바 있다. (이미지=카카오)

카카오엔터프라이즈가 기업용 AI 음성 인식-변환 모델 ‘커스텀 STT(Custom Speech-to-Text)’를 공개했다.

STT는 AI를 활용해 음성을 텍스트로 변환해주는 기능으로 AI 스피커, 음성 검색, 내비게이션 등 다양한 용도로 활용되고 있다.

카카오엔터프라이즈가 공개한 커스텀 STT는 각 기업의 고객과 산업 특성에 맞는 모델을 쉽고 빠르게 구축해 음성 인식-변환의 정확도를 높일 수 있으며 고객사가 직접 단어와 패턴을 추가하면, 가장 적합한 AI 모델을 빠른 시간 내 자동으로 만들어주는 기능이 특징이다.

또한 고유명사나 길고 복잡한 단어 처리도 가능한데, 실제 내부 실험 결과에 따르면 음성인식 오류율이 기존 대비 30% 이상 개선돼 음성인식(STT) 성능이 대폭 향상된 것이 확인됐다고 한다. 그 외에도 클라우드 기반의 '서비스형 AI(AIaaS)'로 기업의 서비스 관리 시간과 비용 부담을 해소할 수 있다는 장점도 있다.

기존 STT 서비스의 경우 수정·개발을 하려면 고객사가 직접 요청사항을 정리해 개발사에 전달하고, 개발사가 해당 모델을 재개발해야 하는 과정을 거쳐야 하는 등 번거로움이 있었다.

반면 커스텀 STT 모델은 고객사가 직접 클라우드에 접속해 제품명, 신기능, 요청 사항 등 새로운 내용을 직접 실시간으로 입력하고 커스터마이즈할 수 있어 시간과 비용을 대폭 절감할 수 있다.

예를 들어 내비게이션 음성 인식 서비스는 새로운 지명이나 주소가 미리 학습돼 있지 않다면 해당 음성을 인식하지 못한다. 하지만 커스텀 STT를 활용하면 내비게이션 운영사가 클라우드에서 직접 새로운 지명이나 주소를 추가할 수 있고, 내비게이션에 즉각적으로 반영된다.

또한 AI 고객센터에 커스텀 STT를 적용하면, 사용자의 최근 주요 요청 사항이나 신제품 출시, 신규 이벤트 등 새로운 정보를 실시간 업데이트해 신속하게 알릴 수 있다.

카카오엔터프라이즈는 올 상반기 오픈 할 ‘카카오 i 커넥트 센터(AICC)’의 문의응대나 상담 업무 등에도 커스텀 STT를 적용할 예정이다. 향후에는 음성인식(STT) 뿐만 아니라 문자인식(OCR), 음성합성(TTS) 분야의 보유 기술도 커스텀이 가능한 서비스형 AI(AIaaS) 모델로 순차 공개한다는 계획이다.

최동진 카카오엔터프라이즈 AI Lab장은 "커스텀 STT는 고객사가 직접 데이터를 쉽게 추가해 자동 학습을 진행하고 커스텀 모델을 만들기 때문에 AI 재학습과 업데이트 소요시간을 크게 단축할 수 있다”며 “기업들은 신속하게 데이터를 변경/추가해 사용자들에게 새로운 정보를 빠르게 전달하고 더 편리한 경험을 제공할 수 있을 것"이라고 밝혔다.

한편, 카카오엔터프라이즈 AI Lab은 카카오 공동체 전체에서 가장 규모가 큰 AI 연구 조직으로, 분사 이후 다양한 산업에서 다수의 기업들과 많은 실험과 서비스 적용을 진행해 왔으며, 지난해에는 글로벌 AI 학회에 총 25건의 논문을 등재하는 성과를 거두었다. 올해에는 API로 AI 실서비스를 바로 만들 수 있는 AIaaS 고도화에 기술 역량을 집중하고 있다.

황정호 기자

jhh@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

카카오헬스케어, ‘파스타’에 혈압까지 담았다…만성질환 관리 플랫폼 확장

카카오헬스케어가 자사의 모바일 건강관리 서비스 ‘파스타(PASTA)’ 기능을 확장하며 만성질환 관리 영역을 넓혔다. 기존 혈당과 체중 중심 관리에서 나아가 혈압 데이터까지 통합하면서, 하나의 앱에서 주요 건강 지표를 종합적으로 관리할 수 있는 구조를 갖췄다.

[현장] 국회서 쏟아진 ‘AX 보안’ 대응법… “AI 확산 속도만큼 보안·법제도 함께 가야”

토론회의 문제의식은 분명했다. AX 시대의 보안은 더 이상 시스템 한켠에 붙는 방어 기능이 아니라 산업 경쟁력과 사회적 신뢰를 지탱하는 핵심 인프라라는 점이다. AI 기술이 기업과 공공, 일상 서비스 전반으로 빠르게 스며드는 상황에서 보안이 뒤따라가는 구조로는 더 이상 대응이 어렵다는 현실 인식도 자리 잡고 있었다. 이날 국회에서 나온 논의는 결국 “AI를 전제로 한 사회에서 어떤 안전 체계를 먼저 갖출 것인가”라는 질문으로 모였다.

채용 공고부터 추천까지 한 번에…AI로 묶은 ‘통합 채용 허브’ 등장

잡코리아가 AI 기반 통합 채용 솔루션 ‘하이어링 센터’를 공개했다. 채용 공고 등록부터 지원자 관리, 커뮤니케이션, 운영 관리까지 전 과정을 하나의 환경에서 처리할 수 있도록 설계된 것이 핵심이다.

정답 아닌 과정 본다…AI 활용 역량, 다면 분석으로 판별

‘AI 역량평가’는 응시자가 AI를 활용해 결과를 도출하는 과정 자체를 분석한다. 프롬프트를 설계하고, AI의 응답을 검증한 뒤 이를 보완해 최종 성과로 연결하는 일련의 단계가 평가 대상이다. 단순 정답 여부가 아니라 활용 과정의 완성도를 데이터 기반으로 측정한다는 점에서 기존 평가와 차별화된다.