Os 5 principais métodos para obter saída de voz da sua linha de comando Linux

Os 5 principais métodos para obter saída de voz da sua linha de comando Linux

Você está procurando infundir alguma criatividade e funcionalidade em seu ambiente Linux? Um recurso delicioso que você pode habilitar é fazer seu terminal Linux falar. Isso pode não apenas adicionar um pouco de diversão, mas também pode ser uma ferramenta prática para várias tarefas. Aqui está uma visão abrangente de algumas excelentes ferramentas de texto para fala disponíveis para Linux que darão voz ao seu terminal.

1. Dominando o eSpeak

O primeiro da nossa lista é o eSpeak, um sintetizador de fala de código aberto, leve e versátil, conhecido por sua velocidade e baixo consumo de recursos. Com suporte para vários idiomas e sotaques, é uma excelente opção para usuários no mundo todo.

Instalar o eSpeak é moleza. Para usuários do Debian ou Ubuntu, basta abrir seu terminal e executar:

sudo apt install espeak

Instalando a ferramenta de linha de comando eSpeak no terminal do Ubuntu.

Se você estiver usando uma distribuição Linux diferente, basta utilizar seu gerenciador de pacotes como DNF, YUM ou Pacman para instalação.

Uma vez instalado, basta digitar espeakseguido do texto que deseja vocalizar:

espeak "Hello from your Linux terminal!"

Seu computador agora irá cumprimentá-lo audivelmente! Para ler texto de um arquivo, use a -fopção seguida pelo nome do arquivo:

espeak -f filename.txt

Você pode personalizar ainda mais sua saída de fala ajustando as configurações de tom (-p) e velocidade (-s):

espeak "Task completed successfully" -p=30 -s=150

Prefere uma voz diferente? O eSpeak permite que você liste as vozes disponíveis com a --voicesopção:

espeak --voices

Lista de vozes do eSpeak exibida no terminal do Ubuntu.

Depois de identificar uma voz específica, inclua-a no seu comando:

espeak -v en-us "Hello, this is eSpeak"

Além disso, você pode simplificar as saídas de comando para fala com:

ls -l | espeak --stdin

2. Explorando o Festival

Em seguida, vamos nos aprofundar no Festival — uma opção excepcional para aqueles que desejam personalização. Com um sistema abrangente de conversão de texto em fala, o Festival fornece várias vozes e controle avançado sobre síntese de fala.

A instalação é direta. Se você estiver no Debian ou Ubuntu, execute:

sudo apt install festival

Para converter texto em fala usando o Festival, você pode emitir o seguinte comando:

echo "Festival is a powerful text-to-speech system." | festival --tts

Se você quiser ler um arquivo de texto, basta executar:

festival --tts textfile.txt

O Festival fornece opções de personalização extensivas, permitindo seleção de voz e ajustes de pronúncia. Para detalhes sobre várias opções, confira a festival --helppágina do manual — perfeita se você busca mais controle sobre sua experiência de síntese de fala.

3. Aproveitando o Google Speech (gTTS)

Em contraste com as soluções offline convencionais, o Google Speech capitaliza a tecnologia de nuvem para explorar os notáveis ​​recursos de síntese de voz do Google. Oferecendo vozes com som natural, é ideal para usuários que valorizam saída de alta qualidade e têm uma conexão com a internet.

Para começar, você precisará da biblioteca gTTS (Google Text-to-Speech) Python. Certifique-se de que Python e pipx estejam instalados e, em seguida, execute:

pipx install gtts

Instalando a ferramenta gTTS usando o Pipx

Em seguida, instale um reprodutor de áudio adequado, como mpg123 ou VLC:

sudo apt install mpg123

Com gTTS e mpg123 prontos, você pode criar uma saída de áudio em uma linha:

gtts-cli "Hello and Welcome to Linux!" --output temp.mp3 && mpg123 temp.mp3

Para explorar os idiomas disponíveis, basta usar a --allopção. Se desejar selecionar um idioma diferente, use a --langopção antes de especificar a saída:

gtts-cli "Hello and Welcome to Linux!" --lang fr --output temp.mp3 && mpg123 temp.mp3

Embora a configuração seja um pouco mais complexa do que a de ferramentas mais simples, se qualidade de voz superior for importante, o gTTS é uma escolha excelente!

4. Empregando o Speech Dispatcher (spd-say)

Se você usou macOS, pode estar familiarizado com o saycomando. Embora não esteja disponível nativamente no Linux, você pode obter funcionalidade semelhante por meio do Speech Dispatcher pareado com seu spd-saycomando.

Para spd-saycomeçar a usar, instale o Speech Dispatcher e um mecanismo de fala — como o eSpeak — se ainda não estiver presente. Para Debian/Ubuntu, digite este comando:

sudo apt install speech-dispatcher

O Speech Dispatcher fornece uma interface de comando unificada para vários sintetizadores de voz, incluindo eSpeak e Festival.

Agora você pode usar spd-saypara fazer seu terminal vocalizar:

spd-say "Hello and Welcome to Linux!"

Isso fará com que o Speech Dispatcher vocalize usando o mecanismo padrão. Não se esqueça de ajustar os atributos de fala, como taxa com -r, tom com -pe volume com -v. Consulte as opções adicionais na página do manual com spd-say --help.

5. Flite leve

Se você está em busca de uma alternativa mais leve, então o Flite é uma escolha excepcional. Projetado para ser um mecanismo de síntese de fala de tempo de execução rápido, é essencialmente uma versão compacta do Festival, perfeito para ambientes com recursos limitados, como computadores mais antigos ou sistemas embarcados.

A instalação na sua distribuição Linux preferida é simples com o gerenciador de pacotes padrão. Para Debian/Ubuntu, execute:

sudo apt install flite

Instalando o Flite TTS

Usar o Flite é semelhante ao eSpeak em sua facilidade de uso. Basta executar:

flite -t "Flite is a small and fast speech synthesis engine."

O Flite é ideal para terminais em sistemas de poucos recursos. Agora você tem várias opções para garantir que seu terminal Linux fale com você! Seja para acessibilidade, diversão ou automação, essas ferramentas oferecem uma experiência emocionante.

Recomendo começar com eSpeak ou Flite devido à sua simplicidade. Quando estiver confortável, explore as opções adicionais que melhor se adaptam às suas necessidades. Você ficará surpreso com o quanto esses comandos podem apimentar sua interação com o Linux!

Crédito da imagem: Frederick Medina via Unsplash. Todas as alterações e capturas de tela por Haroon Javed.

Perguntas frequentes

1. O que é eSpeak e como posso usá-lo?

eSpeak é um sintetizador de fala leve e de código aberto, perfeito para necessidades rápidas de conversão de texto em fala. Para usá-lo, instale-o por meio do seu gerenciador de pacotes e execute-o espeak "Your text here"no terminal.

2. Como instalo o Google Speech (gTTS) na minha máquina Linux?

Para instalar o gTTS, certifique-se de que Python e pipx estejam instalados. Então, simplesmente execute pipx install gttsno seu terminal.

3. Posso personalizar as configurações de fala nessas ferramentas?

Absolutamente! Tanto o eSpeak quanto o Festival permitem que você personalize o tom, a velocidade e a seleção de voz para melhorar a experiência do usuário. Use as respectivas opções no seu comando para ajustes.

Fonte e Imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *