邁入 2025 年之際,Google Gemini 的主要功能將於 2024 年推出

邁入 2025 年之際,Google Gemini 的主要功能將於 2024 年推出

2024 年極大地重塑了技術格局,尤其是谷歌,它在 Gemini 的旗幟下推出了一系列人工智慧創新。該計劃的突出特點是對話式聊天機器人以及多個基礎人工智慧模型。

全年,Google在生成人工智慧領域推出了大量產品和增強功能。除了這些 Gemini 新功能的亮點之外,這家科技巨頭於 2024 年退役的各種產品以及令人期待的 Instagram 功能願望清單也值得探索。

注意:以下清單主要強調 2024 年發布的 Gemini 關鍵功能,但並未涵蓋所有開發內容。

從吟遊詩人到雙子座:品牌重塑革命

今年的一項重大轉變包括谷歌將其 Bard 聊天機器人重新命名為 Gemini,使命名約定與其先前存在的模型保持一致。除了這項轉變之外,這家科技公司還推出了 Gemini 1.0 Pro 模型,並使該聊天機器人可以在 230 個國家/地區以 40 多種語言使用。

一位谷歌工程師解釋了雙子座這個名字背後的象徵意義,將其與以二元性而聞名的黃道帶聯繫起來,這與雙子座處理各種數據類型的能力相似。此外,這個名字是向美國宇航局的雙子座計劃致敬,這是一項早期的月球探索計劃。

推出行動應用程式和訂閱模式

今年 2 月,Google推出了 Android 版 Gemini 應用程序,最終取代 Google Assistant 成為預設語音助理。雖然 Android 用戶接受了新的聊天機器人,但 iOS 用戶可以透過 Google 應用程式存取它。

同月推出了名為 Gemini Advanced 的付費訂閱服務,讓用戶能夠存取最先進的型號,包括 Gemini Ultra 1.0、1.5 Pro 以及 Gemini-Exp-1206 等實驗版本。

Google Chromebook Plus

此外,Chromebook Plus 裝置上還提供了「幫我寫作」等功能,在主畫面應用程式架上提供了方便的 Gemini 按鈕。

將人工智慧整合到谷歌地圖中

三月份,Google透過整合對Google地圖的支持,提高了 Gemini 聊天機器人的實用性。用戶現在可以直接透過聊天機器人發出導航命令。

Google Gemini 自動啟動地圖

例如,用戶可以說“導航到 [X]”,提示 Gemini 提供旅行距離、預計持續時間以及 Google 地圖連結等信息,隨後很快就會啟動導航。

Vids 簡介:一種新的影片製作工具

4 月,Google推出了 Vids,這是一款 Gemini 增強型工具,旨在簡化用於培訓、行銷和其他目的的影片創作。透過時間軸風格的介面,使用者可以直接從應用程式無縫地組合 Google Drive 中的影片資源、錄製畫外音或拍攝影片。

谷歌影片

協作功能允許使用者管理誰可以編輯、評論或查看他們的項目。請注意,Google Vids 是 Workspace 套件中的付費附加元件。

YouTube 音樂集成

Google Gemini YouTube 音樂擴展

5 月,推出了新的 YouTube Music 擴充程序,使 Gemini 用戶能夠與 YouTube Music 互動來發現曲目、收聽廣播電台以及探索新藝人和播放清單。

持續開發:全新 Gemini 模型

2024年,Gemini車款也進行了多項升級。 5 月推出的 Gemini 1.5 Flash 提供了針對摘要、聊天互動、圖像和視訊字幕以及資料提取等任務進行最佳化的輕量級法學碩士。

進一步的增強包括名為 Gemini 1.5 Flash-8B 的更緊湊版本和新的 Gemini 1.5 Pro 型號,該型號具有改進的編碼任務性能。 12 月,Google 發布了實驗性 Gemini 2.0 Flash 模型,該模型支援本地生成的圖像和多語言音訊功能。

詢問照片助理

詢問照片

在 Google I/O 2024 期間,Ask Photos 助理亮相。這個數位助理由 Gemini 提供支持,旨在篩選您的圖庫、生成個人化標題並創建您的旅行快照。

擴展到教育領域

5 月,Google 透過推出兩個新的附加元件:Gemini Education 和 Gemini Education Premium,將 Gemini 功能擴展到教育領域。這些功能包括人工智慧驅動的筆記功能和增強的資料保護措施。

將 Gemini 嵌入工作空間應用程式

為了延續其跨平台整合人工智慧的使命,Google於 6 月在 Workspace 應用程式中推出了 Gemini 側面板。這些面板根據應用程式的上下文自訂功能。例如,Gemini 可以在 Gmail 中總結電子郵件線程,或協助在 Google Slides 中建立簡報幻燈片。

Google Chat 中的 Gemini 側面板

到了 11 月,Google Chat 中添加了 Gemini 側面板,使用戶能夠有效地總結對話。

雙子座直播簡介

在 8 月的 Pixel 硬體活動上,Google推出了 Gemini Live,利用人工智慧聊天機器人打造動態對話體驗。即使應用程式在背景運行或裝置被鎖定,用戶也可以進行自然對話並恢復對話。

該功能最初是 Gemini Advanced 計劃的一部分,後來透過 Android 和 iOS 上的 Gemini 應用程式向所有用戶提供,不久之後又增加了對 40 多種語言的支援。

創建客製化寶石

隨著 Custom Gems 的推出,用戶現在可以針對特定任務自訂自己的 Gemini 聊天機器人,無論是為活動集思廣益還是充當虛擬導師。

Google Gemini 自訂 Gem

150 多個國家的 Gemini Advanced、Business 和 Enterprise 計畫的使用者可以使用此進階功能。用戶可以探索預製寶石或直接透過寶石管理器創建新寶石。

推出 Imagen 3 和攪拌生成器

10 月,Google 發布了頂級文字到圖像生成模型 Imagen 3,它與 Gemini 生態系統無縫集成,支援所有語言。該模型增強了對使用者指令的理解,允許創建逼真的風景、藝術繪畫和富有想像力的場景,並可以進行後續的改進。

Google Whisk 影像產生工具

除了 Imagen 3 之外,Google還推出了 Whisk 工具,可以從現有圖像生成圖像,進一步擴展其創意產品。

Gemini 與 Opera 和 Snapchat 的合作

Google 與 Opera 合作,將 Gemini 的功能整合到 Aria 瀏覽器內人工智慧中,透過先進的文字轉語音和圖像生成功能增強瀏覽體驗。

此外,Snapchat 與 Google 合作改進了 My AI 聊天機器人,從而帶來了更複雜的多模式體驗。報告顯示,這項整合使美國該平台的用戶參與度提高了 2.5 倍。

深度研究:新的人工智慧研究助理

對於從事廣泛研究的人來說,新的深度研究助理旨在簡化流程。該工具有助於徹底的文件分析、摘要以及從大型資料集中提取關鍵見解。

Deep Research 作為 Gemini Advanced 的一部分提供,支援 150 多個國家/地區的超過 45 種語言。

在地圖中使用自然語言導航

Google 地圖最近的增強功能現在允許使用者執行自然語言搜尋。例如,輸入「晚上與朋友要做的事情」會產生建議位置的總結評論,從而提供更直觀的瀏覽體驗。

從 Spotify 串流

隨著 Gemini 的最新更新,與 YouTube Music 一起引入了對 Spotify 的兼容性。用戶現在可以透過 Android 上的 Gemini 介面請求歌曲、瀏覽播放清單以及使用歌詞搜尋音樂,前提是他們擁有 Spotify Premium 帳戶。

圍繞雙子座的爭議

儘管取得了進步,Google的 Gemini 仍面臨爭議。今年 2 月,圖像生成功能因存在偏見而受到批評,導致該服務暫時停止,而谷歌則解決了這個問題。

其他報告指出,即使停用了特定設置,也會發生未經授權的 PDF 摘要事件。此外,調查結果顯示,一個承包商團隊幫助根據競爭模型評估 Gemini 的輸出,引發了有關反應相似性的問題。

來源和圖片

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *