Nvidia mostra modelo de IA que pode modificar vozes e gerar sons

Tecnologia gera efeitos sonoros e música a partir de uma descrição de texto

A Nvidia revelou nesta segunda-feira (25) um novo modelo de inteligência artificial voltado para a geração de música e áudio, capaz de modificar vozes e criar novos sons. A tecnologia, chamada Fugatto (acrônimo de Foundational Generative Audio Transformer Opus 1), foi desenvolvida para atender às necessidades de produtores de música, filmes e videogames.

A Nvidia, líder mundial no fornecimento de chips e softwares para sistemas de IA, informou que não planeja lançar o Fugatto ao público por enquanto. A ferramenta se soma a outras iniciativas similares de startups, como a Runway, e grandes empresas como a Meta, que já oferecem tecnologias para gerar áudio ou vídeo a partir de comandos de texto.

O que a diferencia de outras tecnologias de IA é sua capacidade de captar e modificar o áudio existente, por exemplo, pegando uma linha tocada em um piano e transformando-a em uma linha cantada por uma voz humana, ou pegando uma gravação de palavra falada e alterando o sotaque usado e o humor expresso.

Enquanto empresas como a OpenAI negociam com estúdios de Hollywood sobre o uso da inteligência artificial no setor de entretenimento, a relação entre a indústria tecnológica e Hollywood permanece tensa. Esse cenário se agravou após a atriz Scarlett Johansson acusar a OpenAI de imitar sua voz sem autorização.

O novo modelo da Nvidia, por sua vez, foi treinado com dados de código aberto. A empresa afirmou que ainda está avaliando as condições e possibilidades de torná-lo acessível ao público.

Sair da versão mobile