
Google niedawno ulepszyło swój model Gemini AI o ekscytującą nową funkcję o nazwie Audio Overview. Ta innowacyjna funkcja pozwala użytkownikom konwertować różne typy dokumentów, slajdów i raportów na angażujące dyskusje audio z udziałem dwóch gospodarzy AI, przyjmując format podobny do podcastu.
Jak generować przeglądy audio w Google Gemini
Aby rozpocząć swoją podróż transformacji audio, przejdź bezpośrednio do witryny Gemini lub otwórz odpowiednią aplikację. Poszukaj ikony „+”, znajdującej się tuż obok przycisku Deep Research, i kliknij ją, aby wybrać Pliki.
Ważne jest, aby pamiętać, że Gemini obsługuje szeroką gamę formatów plików, które obejmują standardowe dokumenty tekstowe, takie jak .DOC
i .PDF
, a także reprezentacje danych, takie jak .CSV
. Jeśli pracujesz z plikami kodowania, takimi jak .PHP
lub .JAVA
, możesz potrzebować wersji Gemini Advanced.

Po przesłaniu i przetworzeniu pliku zobaczysz nowy przycisk oznaczony Generate Audio Overview. Kliknij go, aby rozpocząć proces generowania.
Tworzenie przeglądu audio może potrwać kilka minut, w zależności od długości dokumentu. Nie martw się — możesz kontynuować pracę w oknie czatu lub nawet wyjść z Gemini, czekając!
Po zakończeniu odtwarzania na Twoim komputerze lub urządzeniu mobilnym pojawi się powiadomienie (o ile włączono powiadomienia na stronie Gemini) informujące o możliwości rozpoczęcia odtwarzania treści audio.

Aby odsłuchać przegląd audio, po prostu naciśnij przycisk Odtwórz w odtwarzaczu multimedialnym. Odtwarzacz audio Gemini oferuje przydatne funkcje, takie jak pasek postępu ułatwiający nawigację, 10-sekundowe przyciski przewijania do przodu i do tyłu, a także opcje regulacji prędkości dla Twoich preferencji słuchania.

Jeśli korzystasz z aplikacji Gemini, naciśnij przycisk Plus, aby dodać wybrany plik do transformacji.

Po przesłaniu wybranego pliku naciśnij przycisk Generuj przegląd audio, który się pojawi.

Po utworzeniu Przeglądu audio kliknij na wygenerowany wynik. Spowoduje to przejście do domyślnej przeglądarki, w której dostępny będzie Odtwarzacz audio, w którym możesz nacisnąć Odtwórz i rozpocząć słuchanie.


Należy pamiętać, że odtwarzanie przeglądów audio bezpośrednio w aplikacji nie jest obecnie obsługiwane.
Udostępnianie i pobieranie przeglądów audio
Twój nowo wygenerowany podcast jest gotowy do udostępnienia lub zapisania do przyszłego odsłuchania. Aby udostępnić, kliknij Overflow Menu (trzy kropki) i wybierz Share Conversation.

Pojawi się okno dialogowe; po prostu skopiuj utworzony link i udostępnij go gdziekolwiek chcesz.

Jeśli chcesz cieszyć się dźwiękiem offline, pobranie Audio Overview jest proste. Wybierz przycisk Download w Overflow Menu, a proces pobierania rozpocznie się natychmiast.

Funkcja Audio Overviews z Google Gemini to genialne narzędzie dla każdego, kto przetwarza duże ilości informacji. Wraz z rozwojem funkcjonalności Gemini, rozważ eksplorację jego rozszerzeń, aby jeszcze bardziej zwiększyć swoją produktywność.
Źródło obrazu: Unsplash. Wszystkie zrzuty ekranu autorstwa Jay Kakade.
Często zadawane pytania
1. Jakie typy plików mogę przesłać, aby wygenerować przeglądy audio w Google Gemini?
Możesz przesyłać różne typy plików, w tym. DOC, .PDF i. CSV. Jeśli chcesz pracować z plikami programistycznymi, takimi jak. PHP lub. JAVA, będziesz potrzebować Gemini Advanced.
2. Jak udostępnić innym osobom swój przegląd audio?
Aby udostępnić swój przegląd audio, wystarczy kliknąć menu Overflow (trzy kropki), wybrać opcję „Udostępnij rozmowę” i skopiować podany link do udostępniania.
3. Czy mogę odtworzyć przegląd audio bezpośrednio w aplikacji Gemini?
Nie, obecnie Audio Overview nie może być odtwarzane bezpośrednio w aplikacji. Zostaniesz przekierowany do domyślnej przeglądarki, gdzie możesz uzyskać dostęp do odtwarzacza audio.
Dodaj komentarz ▼