5 najlepszych metod uzyskiwania wyjścia mowy z wiersza poleceń systemu Linux

Czy chcesz wnieść trochę kreatywności i funkcjonalności do swojego środowiska Linux? Jedną z zachwycających funkcji, które możesz włączyć, jest sprawienie, aby Twój terminal Linux mówił. Może to nie tylko dodać trochę zabawy, ale może być również praktycznym narzędziem do różnych zadań. Oto kompleksowy przegląd kilku doskonałych narzędzi do zamiany tekstu na mowę dostępnych dla Linuksa, które dadzą Twojemu terminalowi głos.

1. Opanowanie eSpeak

Pierwszy na naszej liście jest eSpeak, wszechstronny i lekki syntezator mowy typu open-source, znany ze swojej szybkości i niskiego zużycia zasobów. Dzięki obsłudze wielu języków i akcentów jest to doskonała opcja dla użytkowników na całym świecie.

Instalacja eSpeak jest dziecinnie prosta. Użytkownicy Debiana lub Ubuntu po prostu otwórzcie terminal i uruchomcie:

sudo apt install espeak

Instalowanie narzędzia wiersza poleceń eSpeak w terminalu Ubuntu.

Jeśli używasz innej dystrybucji Linuksa, po prostu wykorzystaj menedżera pakietów, takiego jak DNF, YUM lub Pacman, do instalacji.

Po zainstalowaniu wystarczy wpisać espeaktekst, który chcesz wypowiedzieć:

espeak "Hello from your Linux terminal!"

Twój komputer przywita Cię teraz słyszalnie! Aby odczytać tekst z pliku, użyj -fopcji, a następnie nazwy pliku:

espeak -f filename.txt

Możesz dodatkowo dostosować wyjście mowy, zmieniając ustawienia wysokości dźwięku (-p) i szybkości (-s):

espeak "Task completed successfully" -p=30 -s=150

Wolisz inny głos? eSpeak umożliwia wyświetlenie listy dostępnych głosów z --voicesopcją:

espeak --voices

Lista głosów eSpeak wyświetlana w terminalu Ubuntu.

Gdy już zidentyfikujesz konkretny głos, uwzględnij go w poleceniu:

espeak -v en-us "Hello, this is eSpeak"

Dodatkowo możesz uprościć wyniki poleceń do postaci mowy za pomocą:

ls -l | espeak --stdin

2. Festiwal eksploracyjny

Następnie zagłębmy się w Festival — wyjątkową opcję dla tych, którzy pragną personalizacji. Dzięki kompleksowemu systemowi zamiany tekstu na mowę Festival zapewnia różne głosy i zaawansowaną kontrolę nad syntezą mowy.

Instalacja jest prosta. Jeśli używasz Debiana lub Ubuntu, wykonaj:

sudo apt install festival

Aby przekonwertować tekst na mowę za pomocą Festival, możesz wydać następujące polecenie:

echo "Festival is a powerful text-to-speech system." | festival --tts

Jeśli chcesz odczytać plik tekstowy, po prostu uruchom:

festival --tts textfile.txt

Festival oferuje rozbudowane opcje dostosowywania, umożliwiając wybór głosu i dostosowanie wymowy. Aby uzyskać szczegółowe informacje na temat różnych opcji, sprawdź festival --helpstronę podręcznika — idealne rozwiązanie, jeśli chcesz mieć większą kontrolę nad swoim doświadczeniem syntezy mowy.

3. Wykorzystanie Google Speech (gTTS)

W przeciwieństwie do konwencjonalnych rozwiązań offline, Google Speech wykorzystuje technologię chmury, aby wykorzystać niezwykłe możliwości syntezy głosu Google. Oferując naturalnie brzmiące głosy, jest idealny dla użytkowników, którzy cenią sobie wysoką jakość wyjścia i mają połączenie z Internetem.

Na początek będziesz potrzebować biblioteki Pythona gTTS (Google Text-to-Speech).Upewnij się, że Python i pipx są zainstalowane, a następnie wykonaj:

pipx install gtts

Instalowanie narzędzia gTTS za pomocą Pipx

Następnie zainstaluj odpowiedni odtwarzacz audio, np.mpg123 lub VLC:

sudo apt install mpg123

Dzięki obsłudze gTTS i mpg123 możesz utworzyć wyjście audio w jednym wierszu:

gtts-cli "Hello and Welcome to Linux!" --output temp.mp3 && mpg123 temp.mp3

Aby sprawdzić dostępne języki, po prostu użyj tej --allopcji. Jeśli chcesz wybrać inny język, użyj tej --langopcji przed określeniem wyjścia:

gtts-cli "Hello and Welcome to Linux!" --lang fr --output temp.mp3 && mpg123 temp.mp3

Mimo że konfiguracja jest nieco bardziej skomplikowana niż w przypadku prostszych narzędzi, jeśli zależy Ci na wysokiej jakości głosu, gTTS będzie doskonałym wyborem!

4. Zatrudnianie Speech Dispatchera (spd-say)

Jeśli korzystałeś z systemu macOS, możesz znać to saypolecenie. Chociaż nie jest ono natywnie dostępne w systemie Linux, możesz uzyskać podobną funkcjonalność za pomocą Speech Dispatcher w połączeniu z jego spd-saypoleceniem.

Aby zacząć spd-saydziałać, zainstaluj Speech Dispatcher i silnik mowy — taki jak eSpeak — jeśli jeszcze go nie ma. W przypadku Debian/Ubuntu wpisz to polecenie:

sudo apt install speech-dispatcher

Speech Dispatcher udostępnia ujednolicony interfejs poleceń dla różnych syntezatorów mowy, w tym eSpeak i Festival.

Teraz możesz użyć, spd-sayaby Twój terminal wydawał dźwięki:

spd-say "Hello and Welcome to Linux!"

Spowoduje to, że Speech Dispatcher zacznie wokalizować przy użyciu domyślnego silnika. Nie zapomnij dostroić atrybutów mowy, takich jak rate za pomocą -r, pitch za pomocą -p, a volume za pomocą -v. Zapoznaj się z dodatkowymi opcjami w man-page za pomocą spd-say --help.

5. Lekki Flite

Jeśli szukasz lżejszej alternatywy, Flite jest wyjątkowym wyborem. Zaprojektowany jako szybki silnik syntezy mowy w czasie wykonywania, jest w zasadzie kompaktową wersją Festival, idealną dla środowisk o ograniczonych zasobach, takich jak starsze komputery lub systemy wbudowane.

Instalacja na preferowanej dystrybucji Linuksa jest prosta dzięki standardowemu menedżerowi pakietów. W przypadku Debian/Ubuntu wykonaj:

sudo apt install flite

Korzystanie z Flite jest podobne do eSpeak pod względem łatwości użytkowania. Wystarczy uruchomić:

flite -t "Flite is a small and fast speech synthesis engine."

Flite jest idealny dla terminali w systemach o niskich zasobach. Teraz masz różne opcje, aby zapewnić, że Twój terminal Linux do Ciebie przemawia! Niezależnie od tego, czy chodzi o dostępność, zabawę czy automatyzację, te narzędzia zapewniają ekscytujące doświadczenie.

Polecam zacząć od eSpeak lub Flite ze względu na ich prostotę. Gdy już poczujesz się pewnie, poznaj dodatkowe opcje, które najlepiej odpowiadają Twoim potrzebom. Będziesz zaskoczony, jak te polecenia mogą urozmaicić Twoją interakcję z Linuksem!

Źródło obrazu: Frederick Medina przez Unsplash. Wszystkie zmiany i zrzuty ekranu autorstwa Haroon Javed.

Często zadawane pytania

1. Czym jest eSpeak i jak mogę z niego korzystać?

eSpeak to lekki, open-source’owy syntezator mowy idealny do szybkich potrzeb zamiany tekstu na mowę. Aby go użyć, zainstaluj go za pomocą menedżera pakietów, a następnie uruchom espeak "Your text here"w terminalu.

2. Jak zainstalować Google Speech (gTTS) na moim komputerze z systemem Linux?

Aby zainstalować gTTS, upewnij się, że Python i pipx są zainstalowane. Następnie po prostu uruchom pipx install gttsw swoim terminalu.

3. Czy mogę dostosować ustawienia mowy w tych narzędziach?

Oczywiście! Zarówno eSpeak, jak i Festival pozwalają dostosować wysokość dźwięku, szybkość i wybór głosu, aby ulepszyć wrażenia użytkownika. Użyj odpowiednich opcji w swoim poleceniu, aby dokonać regulacji.