
Google最近改進了其 Gemini AI 模型,增加了一項令人興奮的新功能,稱為“音頻概覽”。此項創新功能可讓使用者將各種類型的文件、投影片和報告轉換為由兩位 AI 主持人主持的引人入勝的音訊討論,採用類似播客的格式。
如何在 Google Gemini 中產生音訊概覽
要開始您的音訊轉換之旅,請直接導航至Gemini 網站或開啟相應的應用程式。尋找位於深度研究按鈕旁邊的“+”圖標,然後按一下它以選擇檔案。
值得注意的是,Gemini 支援多種文件格式,包括.DOC
和等標準文字文檔.PDF
,以及等資料表示.CSV
。如果您正在使用編碼檔案(例如.PHP
或.JAVA
),則可能需要 Gemini Advanced 版本。

文件上傳並處理後,您會看到一個標有“生成音訊概覽”的新按鈕。按一下此處可啟動生成過程。
建立音訊概覽可能需要幾分鐘,具體取決於文件的長度。別擔心——您可以在聊天視窗中繼續工作,甚至可以在等待時退出 Gemini!
準備好後,您的 PC 或手機上會出現一條通知(前提是您已啟用來自 Gemini 網站的通知),以便您開始欣賞音訊內容。

要收聽音訊概覽,只需點擊媒體播放器上的播放按鈕即可。 Gemini 的音訊播放器提供方便的功能,例如方便導航的進度條、10 秒前進和後退按鈕,以及適合您收聽偏好的速度調整選項。

如果您正在使用Gemini 應用程序,請點擊加號按鈕以新增想要轉換的檔案。

上傳您選擇的檔案後,按下出現的「產生音訊概覽」按鈕。

建立音訊概述後,按一下產生的輸出。這將引導您進入預設瀏覽器,您可以在其中使用音訊播放器按“播放”並開始收聽。


目前,請注意,不支援在應用程式內直接播放音訊概覽。
分享並下載您的音訊概述
您新生成的播客已準備好共享或儲存以供將來收聽。要分享,請點擊溢出選單(三個點)並選擇分享對話。

將會出現一個彈出視窗;只需複製生成的可共享連結並將其分發到您喜歡的任何位置。

如果您希望離線欣賞音頻,下載音頻概覽非常簡單。選擇溢出選單中的下載按鈕,下載過程將立即開始。

Google Gemini 的音訊概覽功能對於處理大量資訊的人來說是一個出色的工具。隨著 Gemini 功能的不斷發展,請考慮探索其擴充功能以進一步提高您的工作效率。
圖片來源:Unsplash。所有截圖均由 Jay Kakade 提供。
常見問題
1.我可以上傳哪些類型的檔案來在 Google Gemini 中產生音訊概覽?
您可以上傳各種文件類型,包括。 DOC,。 PDF,以及。 CSV。如果您希望使用類似的程式設計檔案。 PHP 或。 JAVA,您需要 Gemini Advanced。
2.如何與他人分享我的音訊概覽?
要分享您的音訊概覽,只需點擊溢出選單(三個點),選擇“分享對話”,然後複製提供的可共享連結。
3.我可以直接在 Gemini 應用程式中播放我的音訊概覽嗎?
不可以,目前無法在應用程式內直接播放音訊概覽。它會將您重新導向到您的預設瀏覽器,您可以在其中存取音訊播放器。
發佈留言 ▼