使用 Gemini 將文件轉換為引人入勝的音訊對話

Google最近改進了其 Gemini AI 模型，增加了一項令人興奮的新功能，稱為“音頻概覽”。此項創新功能可讓使用者將各種類型的文件、投影片和報告轉換為由兩位 AI 主持人主持的引人入勝的音訊討論，採用類似播客的格式。

如何在 Google Gemini 中產生音訊概覽

要開始您的音訊轉換之旅，請直接導航至Gemini 網站或開啟相應的應用程式。尋找位於深度研究按鈕旁邊的“+”圖標，然後按一下它以選擇檔案。

值得注意的是，Gemini 支援多種文件格式，包括.DOC和等標準文字文檔.PDF，以及等資料表示.CSV。如果您正在使用編碼檔案（例如.PHP或.JAVA），則可能需要 Gemini Advanced 版本。

文件上傳並處理後，您會看到一個標有“生成音訊概覽”的新按鈕。按一下此處可啟動生成過程。

建立音訊概覽可能需要幾分鐘，具體取決於文件的長度。別擔心——您可以在聊天視窗中繼續工作，甚至可以在等待時退出 Gemini！

準備好後，您的 PC 或手機上會出現一條通知（前提是您已啟用來自 Gemini 網站的通知），以便您開始欣賞音訊內容。

要收聽音訊概覽，只需點擊媒體播放器上的播放按鈕即可。 Gemini 的音訊播放器提供方便的功能，例如方便導航的進度條、10 秒前進和後退按鈕，以及適合您收聽偏好的速度調整選項。

如果您正在使用Gemini 應用程序，請點擊加號按鈕以新增想要轉換的檔案。

上傳您選擇的檔案後，按下出現的「產生音訊概覽」按鈕。

建立音訊概述後，按一下產生的輸出。這將引導您進入預設瀏覽器，您可以在其中使用音訊播放器按“播放”並開始收聽。

目前，請注意，不支援在應用程式內直接播放音訊概覽。

您新生成的播客已準備好共享或儲存以供將來收聽。要分享，請點擊溢出選單（三個點）並選擇分享對話。

將會出現一個彈出視窗；只需複製生成的可共享連結並將其分發到您喜歡的任何位置。

如果您希望離線欣賞音頻，下載音頻概覽非常簡單。選擇溢出選單中的下載按鈕，下載過程將立即開始。

Google Gemini 的音訊概覽功能對於處理大量資訊的人來說是一個出色的工具。隨著 Gemini 功能的不斷發展，請考慮探索其擴充功能以進一步提高您的工作效率。

圖片來源：Unsplash。所有截圖均由 Jay Kakade 提供。

您可以上傳各種文件類型，包括。 DOC，。 PDF，以及。 CSV。如果您希望使用類似的程式設計檔案。 PHP 或。 JAVA，您需要 Gemini Advanced。

要分享您的音訊概覽，只需點擊溢出選單（三個點），選擇“分享對話”，然後複製提供的可共享連結。

不可以，目前無法在應用程式內直接播放音訊概覽。它會將您重新導向到您的預設瀏覽器，您可以在其中存取音訊播放器。