O que é IA de áudio estável e como usá-lo

A Inteligência Artificial tornou-se onipresente e está sendo usada para uma ampla gama de propósitos, incluindo geração de imagens, conteúdo baseado em texto e até produção de som e música. E Stable Audio AI é um dos melhores modelos de IA para produção de áudio disponíveis atualmente.

Neste guia, veremos o que é essa plataforma de IA e como você pode usá-la para criar áudio original sem precisar de nenhum instrumento musical.

O que é IA de áudio estável?

Stable Audio AI é um modelo de IA desenvolvido pela Stability AI, mais conhecida por sua Stable Diffusion AI, que pode gerar imagens com base em prompts fornecidos pelo usuário.

Stable Audio usa técnicas avançadas de inteligência artificial (especificamente modelos de difusão) para criar áudio a partir de descrições de texto. Você digita que tipo de música ou som deseja e ele os gera em segundos.

O Stable Audio AI foi criado pela Harmonai, o laboratório de pesquisa de áudio da Stability AI, e permite aos usuários gerar áudio original usando prompts.

O que torna este modelo de IA de geração de áudio tão impressionante é que ele foi treinado em 19.500 horas de dados de áudio da principal biblioteca de música digital, AudioSparx. Mais de 800.000 arquivos de áudio foram usados para treiná-lo, o que permitiu que a IA se tornasse capaz de gerar 95 segundos de áudio com qualidade estéreo de 44,1 kHz usando uma GPU Nvidia A100 em menos de um segundo.

Ele consegue fazer isso usando uma tecnologia de difusão latente semelhante à Stable Diffusion AI da empresa para geração de imagens. E, ao contrário de outros modelos de IA de geração de áudio, o Stability Audio AI pode ser usado para criar sons de diferentes durações.

Você pode usar Stable Audio AI para gerar sons de instrumentos únicos, sons ambientes ou até mesmo um conjunto completo. Agora vamos entender como gerar áudio utilizando-o.

Comece com a IA de áudio estável

Você pode experimentar o Stable Audio AI para gerar áudio usando Inteligência Artificial gratuitamente, mas isso exigirá a criação de uma conta no site do Stable Audio. A conta gratuita também tem certas limitações.

Inicie seu navegador e acesse o site Stable Audio . Uma vez lá, clique no botão azul em forma de cápsula no canto superior direito que diz ‘Experimente gratuitamente’.

Clicar no botão o levará a uma nova página onde você pode criar uma conta necessária para usar o Stable Audio AI. Você pode configurar uma nova conta digitando seu endereço de e-mail e uma senha ou fazer login através de sua conta do Google.

Se você optar por fazer login usando sua conta do Google, precisará fornecer autorização ao Google para compartilhar os detalhes da sua conta com o site. Depois de inserir o nome de usuário e a senha da sua conta do Google, clique no botão ‘Continuar’ para fornecer a autorização necessária.

Depois de fazer login, você será saudado pela página inicial da plataforma Stable Audio AI. Ele conterá os termos e condições que você deverá aceitar para prosseguir. Você também pode optar por se inscrever no boletim informativo Stable Audio aqui. Clique no botão ao lado de onde diz ‘Li e aceito os termos e condições’ e, se desejar, no botão abaixo para assinar a newsletter. Em seguida, clique no botão ‘Avançar’ na parte inferior.

Aceitar os termos e condições o levará ao painel de áudio estável, que pode ser usado para gerar áudio original usando prompts.

Usando IA de áudio estável

A seção superior esquerda da página será onde você poderá inserir prompts para geração de áudio.

Você pode inserir um prompt como Hard rock, concert promotion, metal, 180 bpmna caixa. Em seguida, clique no botão ‘Gerar’ na parte inferior para começar a criar áudio.

Outra forma de gerar áudio é usar prompts prontos da ‘Biblioteca de Prompts’ localizada abaixo da seção de prompts, onde você pode acessar diferentes estilos de prompts de áudio. Para fazer isso, clique no botão em forma de cápsula denominado ‘Nenhum’. Isso abrirá a biblioteca, que contém vários estilos que você pode escolher para adicionar ao seu áudio.

Para selecionar qualquer um dos estilos de prompt de áudio da biblioteca, basta clicar nele. A seção de prompts acima da biblioteca mostrará os prompts que o estilo contém. O estilo selecionado adquirirá um ícone de reprodução e o rótulo no botão da biblioteca de prompt também mudará para refletir o estilo selecionado.

Abaixo da ‘Biblioteca de Prompts’, você pode ver o modelo AI usado para o processo de geração de áudio. Clicar no nome do modelo, neste caso, ‘Stable-audio-audiosparx-v1-0’, mostrará todos os modelos disponíveis. Existe apenas um modelo adicional disponível no momento, que está em Beta. Você precisará atualizar para o plano Pro para usar o modelo Beta AI.

A seguir está a seção ‘Duração’, onde você pode controlar a duração do áudio gerado. Clicar na seta apontando para baixo diminuirá a duração, enquanto clicar na seta apontando para cima irá aumentá-la. A versão gratuita do Stable Audio permite gerar áudio com 45 segundos de duração. Se você atualizar para a versão Pro, poderá gerar áudio com duração de um minuto e 30 segundos.

O último item do lado esquerdo é a opção ‘Adicionar Extras’ que você pode usar para personalizar seu áudio. Clique no botão ‘+’ para ver as opções disponíveis, que atualmente incluem ‘Etapas’, ‘Número de resultados’, ‘Semente’ e ‘Força do prompt’.

Cada uma dessas opções extras possui configurações que podem ser personalizadas. Por exemplo, se você clicar na opção ‘Etapas’, poderá aumentar o número de etapas que a IA executa para gerar áudio. Por padrão, 50 etapas são adicionadas e você pode aumentá-las para 100 digitando o número de etapas na caixa fornecida.

Você pode voltar ao valor padrão clicando no botão ‘Redefinir’ na parte inferior. Se você quiser remover todos os extras, clique no botão ‘X’ próximo à caixa onde o número de etapas deve ser inserido.

Quando terminar, clique no botão ‘Gerar’ e o Stable Audio começará a gerar seu áudio. Alternativamente, você pode remover as etapas e usar outro dos extras, como a opção ‘Seed’, que controla a aleatoriedade da geração do áudio. Por padrão, a opção está definida como ‘Aleatório’, o que significa que o modelo de IA usará diferentes arranjos de áudio para gerar áudio. Você pode inserir um valor diferente clicando no rótulo ‘Aleatório’ e digitando um valor como ‘222222’ para fazer com que a IA use o mesmo arranjo todas as vezes.

Outros extras incluem ‘Número de resultados’ e ‘Força do prompt’. O primeiro é um recurso Pro que permite controlar o número de faixas que a IA retornará para o prompt (5 no máximo) e não pode ser usado na versão gratuita. No entanto, você pode experimentar a opção ‘Força do prompt’ clicando nela. Isso abrirá um controle deslizante que controla o quão próximo o áudio gerado estará do prompt fornecido. Por padrão, está definido como 80%, mas você pode arrastar o controle deslizante para a esquerda ou para a direita para diminuir ou aumentar a intensidade conforme necessário.

Depois de ajustar a intensidade do prompt, clique no botão ‘Gerar’ para dizer à IA para começar a criar o áudio. O lado superior direito da página Stability Audio AI também contém alguns itens. O primeiro deles é um símbolo de nota musical que indica o número de créditos que os usuários gratuitos possuem. Você só pode gerar áudio desde que tenha créditos e receba 20 créditos por mês. Em seguida, há um botão que permite atualizar para a versão Pro, uma opção para verificar os dados da sua conta e um menu hambúrguer contendo opções adicionais.

Clicar no botão ‘Atualizar para Pro’ mostrará os planos de preços disponíveis. Além do plano gratuito, você pode escolher entre os planos Pro, Studio e Max que custam US$ 11,99/mês, US$ 29,99/mês e US$ 89,99/mês respectivamente. O plano ‘Free’ permite gerar 20 faixas por mês, enquanto o ‘Pro’ permite 500 faixas. Isso sobe para 1.350 com o plano ‘Studio’ e 4.500 com o plano ‘Max’. Além disso, embora a duração da faixa no plano ‘Free’ seja de 45 segundos, é de 90 segundos em todos os outros planos. O plano ‘Gratuito’ vem com uma licença pessoal, enquanto você obtém uma licença de Criador com as outras opções.

A opção ao lado do botão de atualização mostra detalhes da sua conta na plataforma Stable Audio AI. Clicar nele informará sobre seu plano atual e tudo o que ele oferece.

Refinando suas solicitações

Ao refinar seus prompts, você pode ajustar a saída que o Stability Audio fornece. Ao trabalhar com IA generativa, quanto melhores forem suas solicitações, melhor será o resultado. Aqui estão algumas maneiras pelas quais você pode melhorar seus prompts.

Se a saída soar muito eletrônica ou digital, considere usar palavras como ‘Band’ ou ‘Live’ no prompt.
Você pode melhorar a qualidade da saída gerada incluindo palavras como ‘44,1kHz’, ‘alta qualidade’ e ‘estéreo’ no prompt.
Use a palavra ‘Solo’ após o nome do instrumento principal na faixa para melhorar a saída. Por exemplo, se o instrumento principal for um violino, você pode usar ‘Solo Violin’ no prompt.

Com Stability Audio AI, você pode gerar facilmente faixas de áudio impressionantes apenas usando prompts. Se você é iniciante, o plano gratuito é uma excelente forma de experimentar o modelo, enquanto músicos profissionais podem atualizar para os planos pagos e conferir os recursos mais avançados oferecidos pela plataforma.

O que é IA de áudio estável e como usá-lo

O que é IA de áudio estável?

Comece com a IA de áudio estável

Usando IA de áudio estável

Refinando suas solicitações

Artigos relacionados:

O último vazamento do Nothing Phone 2a finalmente nos dá uma visão adequada de como será o suposto rei do orçamento

O criador de Devil May Cry adoraria refazer a primeira entrada da série, Viewtiful Joe e Bayonetta

Deixe um comentário Cancelar resposta