엔비디아, 혁신적인 AI 오디오 생성기 '푸가토' 공개

NVIDIA has announced Fugatto, a new AI audio generation model. The model is notable for its ability to create unprecedented sounds. Fugatto can create, transform, and manipulate sounds using text and audio inputs. It can produce unique sounds like a trumpet barking or a saxophone meowing, and it can also generate high-quality singing voices from text prompts. Key features of this AI model include generating music snippets from text, modifying existing songs, changing voice characteristics, and creating entirely new sounds. Nvidia describes Fugato as “an all-around tool for sound.”

엔비디아가 새로운 AI 오디오 생성 모델 '푸가토(Fugatto)'를 발표했다. 이 모델은 전례 없는 소리를 만들어낼 수 있는 능력을 갖추고 있어 주목받고 있다. 푸가토는 텍스트와 오디오 입력을 사용해 소리를 생성, 변형, 조작할 수 있다. 트럼펫이 짖는 소리나 색소폰이 야옹거리는 소리 같은 독특한 음향을 만들어낼 수 있으며, 텍스트 프롬프트로 고품질의 노래하는 목소리도 생성 가능하다. 이 AI 모델의 주요 기능으로는 텍스트로 음악 스니펫 생성, 기존 노래 수정, 음성 특성 변경, 완전히 새로운 소리 생성 등이 있다. 엔비디아는 푸가토를 "소리를 위한 만능 도구"라고 설명했다.

앨리스

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

메타, 직원 8,000명 해고…역대 최고 실적에도 AI 투자 위해 감원

메타가 5월 20일부터 전 직원의 10%인 8,000명을 감원한다. 역대 최고 분기 실적에도 AI 인프라 투자를 위한 결정으로, 직원 사기 급락과 내부 반발이 이어지고 있다.

탠스택 오픈소스 공급망 공격, 오픈AI까지 피해..."사용자 데이터는 안전"

오픈소스 라이브러리 탠스택을 겨냥한 공급망 공격으로 오픈AI 직원 기기 2대가 침해됐다. 사용자 데이터와 핵심 시스템은 안전하나 일부 소스코드가 탈취됐으며, 맥OS 앱 업데이트가 필요하다.

포드, 에너지 저장 사업 진출 선언...AI 데이터센터 특수 전환 기대감

포드가 에너지 저장 사업 진출을 선언한 후 이틀간 주가 21% 급등. 약 2조 8,960억원(20억 달러)을 투자해 켄터키 공장을 전환하고, 2027년 납품을 목표로 한다. 모건스탠리는 사업가치 약 100억 달러를 전망했다.

인텔, 애플 칩 시험 생산 착수…2027년 양산 목표

인텔이 애플 칩 위탁 생산 테스트를 시작했다. 밍치 궈 분석가에 따르면 2027년 양산을 목표로 18A-P 공정을 활용하며, 물량의 80%는 아이폰용이다. TSMC는 여전히 90% 이상 공급을 담당한다.