Explorando a nova IA de áudio do Microsoft Copilot: um som mais pessoal do que o ChatGPT

Explorando a nova IA de áudio do Microsoft Copilot: um som mais pessoal do que o ChatGPT

A Microsoft continua inovando com suas ferramentas de IA, apresentando recentemente o Copilot Vision, um poderoso utilitário de análise de tela. Após o lançamento, a empresa está testando um novo recurso chamado Copilot Audio Expressions, uma ferramenta capaz de gerar áudio semelhante ao humano para seus scripts. Essa tecnologia avançada de IA não apenas lê o texto em voz alta, mas também o interpreta criativamente com base em suas informações.

Os interessados ​​podem testar esta ferramenta no site oficial do Copilot Labs, onde ela apresenta dois modos distintos: Emotivo e História. Os usuários têm acesso a quase uma dúzia de variações de voz e estilo. Uma avaliação detalhada conduzida pelo Windows Latest destacou a eficácia da ferramenta, especialmente em seus recursos em inglês.

Em sua exploração, o Windows Latest começou com um roteiro fictício representando uma estação de trem movimentada. Eles inseriram o roteiro na ferramenta, especificando o estilo de voz desejado. A escolha foi utilizar a opção Emote com a voz do Oak e um estilo de narração.

Selecionando o modo de áudio do Copilot

O aplicativo gerou rapidamente um clipe de áudio que pôde ser reproduzido usando o player web integrado. Notavelmente, o modo Emote permite clipes de áudio de até 59 segundos de duração. Os usuários poderiam esperar uma voz de IA direta recitando o texto; no entanto, o resultado foi mais dinâmico. A IA aprimorou habilmente o roteiro, introduzindo elementos adicionais e reformulando a frase para aumentar o engajamento, resultando em uma experiência auditiva mais envolvente.

Outro recurso de destaque é a possibilidade de baixar o arquivo de áudio em formato MP3 sem a necessidade de uma conta de usuário, facilitando a reprodução em diversos dispositivos. O modo Emote apresentou opções de personalização impressionantes, despertando também a curiosidade sobre o modo História.

Criando narrativas envolventes com o Modo História

Explorando mais a fundo, o Windows Latest migrou para o modo História, que seleciona automaticamente a voz e o estilo sem oferecer ajustes individuais. Ao inserir um prompt básico — “conte uma história sobre um gato espreitando nas sombras em busca de presas” — a ferramenta gerou uma narrativa criativa de 90 segundos. Essa história incluía a voz de um narrador humano, apresentada com sotaque americano, e a voz única do gato, com sotaque britânico, proporcionando uma experiência de áudio divertida.

Selecionando o modo de história da IA ​​do Copiloto

Os ouvintes podem explorar a qualidade da saída verificando os dois trechos de áudio produzidos pela ferramenta.

No geral, a ferramenta Copilot Audio Expressions se destaca como uma solução impressionante de geração de áudio por IA, ideal para criar clipes de áudio envolventes. Se você tem interesse em experimentar essa tecnologia inovadora, visite o site do Copilot Labs e experimente.

Fonte e Imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *