엔비디아, 혁신적인 AI 오디오 생성기 '푸가토' 공개

NVIDIA has announced Fugatto, a new AI audio generation model. The model is notable for its ability to create unprecedented sounds. Fugatto can create, transform, and manipulate sounds using text and audio inputs. It can produce unique sounds like a trumpet barking or a saxophone meowing, and it can also generate high-quality singing voices from text prompts. Key features of this AI model include generating music snippets from text, modifying existing songs, changing voice characteristics, and creating entirely new sounds. Nvidia describes Fugato as “an all-around tool for sound.”

엔비디아가 새로운 AI 오디오 생성 모델 '푸가토(Fugatto)'를 발표했다. 이 모델은 전례 없는 소리를 만들어낼 수 있는 능력을 갖추고 있어 주목받고 있다. 푸가토는 텍스트와 오디오 입력을 사용해 소리를 생성, 변형, 조작할 수 있다. 트럼펫이 짖는 소리나 색소폰이 야옹거리는 소리 같은 독특한 음향을 만들어낼 수 있으며, 텍스트 프롬프트로 고품질의 노래하는 목소리도 생성 가능하다. 이 AI 모델의 주요 기능으로는 텍스트로 음악 스니펫 생성, 기존 노래 수정, 음성 특성 변경, 완전히 새로운 소리 생성 등이 있다. 엔비디아는 푸가토를 "소리를 위한 만능 도구"라고 설명했다.

앨리스

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

삼성, 멀미 완화 앱 '히어라피' 출시...이어폰으로 60초 들으면 2시간 효과

삼성이 이어폰으로 멀미를 완화하는 무료 앱 '히어라피'를 출시했다. 100Hz 저음 사인파를 60초간 들으면 최대 2시간 멀미 증상이 억제되며, 갤럭시 버즈4 프로 외 타사 이어폰에서도 사용 가능하다.

“남들 다 포기할 때 거꾸로 간다”… 토요타, 볼보·다임러와 ‘수소 동맹’ 전격 결성

세계 최대 자동차 기업 토요타가 전기차로 쏠린 업계 흐름에 맞서 수소 연료전지 시장에 승부수를 던졌다.

이란, 애플·구글·마이크로소프트 등 미국 기업 18곳 타격 경고

이란 혁명수비대(IRGC)가 애플·구글·마이크로소프트 등 미국 기업 18곳을 중동에서 타격하겠다고 경고했다. 4월 1일 오후 8시(테헤란 기준)를 데드라인으로 제시하며 직원 대피를 촉구했다.

음식 칼로리 계산하고 3개국어 번역까지… 메타, ‘진화한 스마트 안경’ 전격 공개”

메타가 레이밴(Ray-Ban)의 모회사 에실로룩소티카와 협력해 인공지능(AI) 기능을 대폭 강화한 차세대 스마트 안경 ‘옵틱스(Optics)’ 라인업을 선보였다.