Poznaj nową sztuczną inteligencję audio Microsoft Copilot: bardziej spersonalizowane brzmienie niż w ChatGPT

Poznaj nową sztuczną inteligencję audio Microsoft Copilot: bardziej spersonalizowane brzmienie niż w ChatGPT

Microsoft nieustannie wprowadza innowacje w swoich narzędziach AI, prezentując niedawno Copilot Vision, potężne narzędzie do analizy ekranu. Po tej premierze firma testuje teraz nową funkcję o nazwie Copilot Audio Expressions, narzędzie umożliwiające generowanie dźwięku przypominającego dźwięk ludzki w skryptach. Ta zaawansowana technologia AI nie tylko odczytuje tekst na głos, ale także potrafi go kreatywnie interpretować na podstawie danych wprowadzanych przez użytkownika.

Zainteresowani mogą przetestować to narzędzie na oficjalnej stronie Copilot Labs, gdzie oferuje ono dwa różne tryby: Emotive i Story. Użytkownicy mają dostęp do niemal tuzina wariantów głosu i stylu. Szczegółowa ocena przeprowadzona przez Windows Latest podkreśliła skuteczność narzędzia, szczególnie w zakresie obsługi języka angielskiego.

W swoich eksperymentach Windows Latest rozpoczął od fikcyjnego scenariusza przedstawiającego tętniący życiem dworzec kolejowy. Wprowadzali go do narzędzia, określając pożądany styl głosu. Zdecydowali się na użycie opcji emotikonów z głosem dębowym i narracją.

Wybieranie trybu audio drugiego pilota

Aplikacja szybko wygenerowała klip audio, który można było odtworzyć za pomocą wbudowanego odtwarzacza internetowego. Co ciekawe, tryb emotikon pozwala na tworzenie klipów audio o długości do 59 sekund. Użytkownicy mogli oczekiwać prostego głosu sztucznej inteligencji recytującego tekst, jednak wynik był bardziej dynamiczny. Sztuczna inteligencja umiejętnie udoskonaliła skrypt, wprowadzając dodatkowe elementy i parafrazy, aby zwiększyć zaangażowanie, co przełożyło się na bardziej wciągające wrażenia słuchowe.

Kolejną wyróżniającą się funkcją jest możliwość pobrania pliku audio w formacie MP3 bez konieczności zakładania konta użytkownika, co ułatwia odtwarzanie na różnych urządzeniach. Tryb emotikonów oferował imponujące możliwości personalizacji, co wzbudziło również zainteresowanie trybem fabularnym.

Tworzenie angażujących narracji w trybie fabularnym

W dalszej części, Windows Latest przeszedł do trybu Story, który automatycznie wybiera głos i styl, bez konieczności wprowadzania indywidualnych zmian. Po wpisaniu prostego komunikatu – „opowiedz historię o kocie czającym się w cieniu, by upolować ofiarę” – narzędzie wygenerowało kreatywną, 90-sekundową narrację. W tej opowieści narrator mówił ludzkim głosem z amerykańskim akcentem, a kot z brytyjskim, co zapewniało rozrywkowe wrażenia dźwiękowe.

Wybieranie trybu opowieści Copilot AI

Słuchacze mogą ocenić jakość wyjściową, sprawdzając oba fragmenty audio wygenerowane przez narzędzie.

Podsumowując, narzędzie Copilot Audio Expressions wyróżnia się jako imponujące rozwiązanie do generowania dźwięku oparte na sztucznej inteligencji, idealne do tworzenia angażujących klipów audio. Jeśli chcesz wypróbować tę innowacyjną technologię, koniecznie odwiedź stronę Copilot Labs i wypróbuj ją.

Źródło i obrazy

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *