드디어 시작된 ‘챗GPT’와 음성대화, 얼마나 흥미진진할까요?

[AI요약] 생성형 AI챗봇 챗GPT가 이제 사용자와 대화를 할수 있게 된다. 챗GPT와 대화는 이미 비슷한 기능을 제공하는 음성 AI비서 아마존의 알렉사, 애플의 시리 등과는 어떤 차별점이 있을지 주목받고 있다.

오픈AI가 챗GPT의 음성대화 기능을 공개했다. (이미지=월스트리트저널뉴스 갈무리)

세상을 휩쓴 AI챗봇, 챗GPT와의 대화는 어떨까.

생성형 AI챗봇 서비스인 ‘챗GPT’(ChatGPT)의 음성대화 기능에 대해 더가디언, CNN 등 외신이 27일(현지시간) 보도했다.

챗GPT를 개발한 오픈AI(OpenAI)는 사용자가 챗봇과 음성 대화에 참여할수 있는 새로운 기능을 공개했다. 이 기능은 현재 아마존의 알렉사(Alexa), 애플의 시리(Siri) 등 기존의 음성 AI비서 서비스와 유사하다. 챗봇과 함께 상호작용하며 큰소리로 대화할수 있는 기능이다.

그러나 기업이 블로그 게시물을 통해 공개한 챗GPT의 음성대화 기능은 좀더 흥미진진해 보인다. 예를들어, ‘저녁 식사 대화 주제를 선정하는 방법’이라든지, ‘아이에게 들려줄 취침 전 이야기’ 등 친근하면서도 실제로 유용한 대화를 챗봇과 나눌수 있기 때문이다.

오픈AI가 공유가 새 업데이트 데모에서 사용자는 챗봇에 ‘래리라는 이름의 고슴도치에 대한 이야기를 만들어 달라’고 요청한다. 그러면 챗봇은 ‘그의 집은 어땠나요?’, ‘그의 가장 친한 친구는 누구인가요?’와 같은 사용자의 질문에 응답하면서 이야기를 이어간다.

챗GPT의 음성기능은 새로운 텍스트 음성 변환 모델을 기반으로 하며, 텍스트와 몇초의 샘플 음성만으로 인간과 유사한 오디오를 생성할 수 있다. 사용자가 입력한 텍스트를 소리내어 말할수 있다는 의미다. 오픈AI는 전문 성우들과 협력해 챗봇에 애니메이션을 적용하는 데 사용할수 있는 다섯 가지 목소리를 만들었다.

또한 오픈AI는 챗봇이 이미지가 포함된 프롬프트에 응답할수 있는 새로운 기능을 출시한다. 예를 들어, 냉장고 속 내용물의 사진을 찍어 챗GPT에 보여주면, 이미 가지고 있는 재료를 활용해 식사 계획을 세우는데 도움을 받을 수 있다. 앱에 있는 ‘그리기 도구’를 사용하면 챗봇에 이미지의 특정 부분에 집중하도록 요청할수도 있다.

이외에도 작동되지 않은 기계를 보여주고 이유를 물어보고, 업무와 관련된 복잡한 데이터와 그래프를 분석하도록 물어볼수도 있다.

이러한 오픈AI의 업데이트는 지난해 말 챗GPT 공개 출시로 촉발된 기술업계 AI 기술의 치열한 경쟁 중에 나왔다. 챗GPT는 공개 이후 문서요약부터 컴퓨터 코드 작성 등 광범위한 작업에 도움을 주면서 많은 기업이 이 기술을 채택했다.

최근 몇주 동안 거대 기술 기업들은 더 많은 AI 기반 도구를 핵심 제품에 직접 통합하는 새로운 업데이트를 공개하고 있다.

실제로 지난주 구글은 챗GPT에 맞서 자사의 AI챗봇 바드(Bard)에 대한 일련의 업데이트를 발표했다. 아마존 역시 비슷한 시기에 AI 음성 비서 알렉사 생성 AI 기반의 업데이트를 도입할 것이라고 발표했다. 이를 위해 아마존은 최대 40억달러(약 5조4160억원)를 해당 기술에 투자할 계획이다.

챗GPT의 음성기능은 앞으로 2주 이내 공개되며, 아쉽게도 챗GPT 플러스 및 엔터프라이즈 요금제 가입자만 사용이 가능하다. 플러스 서비스 구독료는 월 20달러(약 2만 7000원)이며, 엔터프라이즈 서비스는 현재 비즈니스 사용자에게만 제공되고 있다.

오픈AI는 “챗GPT의 음성 대화 서비스는 창의적이고 접근성에 초점을 맞춘 많은 애플리케이션에 대한 가능성을 열어줄 것”이라고 블로그 게시물을 통해 밝혔다.

류정민 기자

znryu@daum.net
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

[인터뷰] 리뉴어스랩 이재용 대표, 박태근 CPO, 김상용 COO “공급망 탄소 중립을 위한 데이터 공유 솔루션을 만들고 있습니다”

글로벌 기업이 직접 관리할 수 있는 스콥1, 2에 비해 공급망 내 존재하는 관계사의 탄소 배출 데이터까지 완벽하게 수집하기는 쉬운 일이 아니다. 리뉴어스랩은 바로 이 과정에서 글로벌 기업의 협력사에게 탄소배출 관리 서비스를 제공하고 데이터를 수집하는 비즈니스 모델과 다시 이 데이터를 가공해 글로벌 기업에 제공하고 수수료를 얻는 비즈니스 모델을 제시하고 있다.

영화 ‘her’의 그 목소리? 스칼렛 요한슨의 법적대응과 오픈AI가 벌인 어리석은 짓

지난주 오픈AI가 야심차게 공개한 챗GPT 4.0 음성비서 ‘스카이’가 잠정 중단이라는 결말을 맞이했다. 스카이는 공개되자마자 그 목소리가 스칼렛 요한슨이 출연한 영화 의 가상 음성 비서와 너무 유사하다는 지적을 받았으며, 요한슨은 결국 오픈AI를 상대로 법적 대응에 나섰다. 또한 스카이의 목소리가 지나치게 남성 중심의 환상에서 나온 것 같다는 비판이 제기되면서 기업의 안전 문화 프로세스가 안일하다는 비판이 제기되고 있다.

중국, 태양광 휴머노이드 우주정거장으로···미국을 긴장시킬 성능

중국은 태양광 동력만으로 작동하는 경량 휴머노이드 로봇인 ‘타이코봇’을 자사의 우주정거장인 ‘톈궁’으로 보낼 준비를 마쳤다. 25kg에 불과한 타이코봇은 지상 우주선 목업 실험에서 다양한 우주선내 활동 효율성을 과시하면서 무거운로보넛2(220kg)를 ISS에 보내 우주 수술을 시험했고 여전히 테스트 중인 미국을 긴장시키기에 충분해 보인다.

KOBA 2024 현장 속으로… 클론보이스, 모션캡쳐, AI 영상 검색 및 편집 기술 돋보여

이날 기술력으로 승부하는 국내 기술 기업들에 대한 관심 역시 적지 않았다. 인공지능(AI) 기술을 활용해 다국어 자막 생성과 더빙을 서비스 ‘레터웍스’를 개발한 스타트업, ‘트위그팜’은 이날 행사 부스에 생성형 AI 기반 클론보이스 더빙 기능을 소개했다. 모션테크놀로지는 이번 전시회에서 지난 3월 미국 샌플란시스코에서 열린 ‘GDC 2024’에 첫 선 보인 ‘YanusSTUDIO’ 등 4개의 체험존을 운영하며 이목을 집중시키고 있다. 씨이랩은 자사 플래그십 서비스 ‘VidiGo(비디고)’ 내 AI 영상 검색 기술을 탑재한 ‘VidiGo Search Engine(비디고 서치엔진)’을 선보여 주목을 받았다.