Google推出 Gemini 2.5 Flash 影像 – 進階影像生成模型

Google發布尖端 Gemini 2.5 Flash 影像模型

谷歌取得了重大突破，推出了Gemini 2.5 Flash Image，這是一款革命性的圖像生成和編輯模型，內部稱之為「奈米香蕉」。這款先進的工具旨在產生和修改影像，同時確保字元的一致性，並將各種影像無縫合併為一個連貫的最終結果。

提升影像編輯標準

根據 LMArena 報導，Gemini 2.5 Flash Image 已迅速躋身影像編輯模型的巔峰，超越了 OpenAI 的 GPT Image 1 和 Flux.1 Kontext 等競爭對手。從歷史上看，早期的圖像生成模型在視覺美學方面表現出色，但往往在準確解讀現實世界語義方面有所不足。 Gemini 2.5 模型利用豐富的世界知識，增強了影像輸出的真實感和準確性。

為創意人員和開發者提供無障礙服務

這款最新模型可供消費者和開發者輕鬆使用。對於開發者而言，Gemini 2.5 Flash Image 可透過各種平台使用，包括 Gemini API、Google AI Studio 以及滿足企業級需求的 Vertex AI。其定價為每百萬個輸出代幣 30 美元，平均每張圖片約 0.039 美元。

消費者可以透過 Gemini 網頁和行動應用程式體驗這款創新車型的功能。谷歌重點介紹了一系列變革性用例，用戶可以透過 Gemini 應用程式進行探索：

服裝和位置增強：使用者可以上傳自己的照片或寵物的照片，並輕鬆地將它們放置在新的動態設定中，同時保持其原始外觀。

照片融合：此模型允許合併多張影像，打造全新場景。例如，您可以將自己的肖像與愛犬的肖像融合，打造籃球場上共同的迷人時刻。

迭代編輯：使用者可以進行多輪編輯，從空房間開始，逐步添加牆壁顏色、書架或家具等元素，以創建他們設想的空間。

設計融合：使用者可以創意地將一幅圖像的美感（如花卉圖案）應用到另一幅圖像中的物體（如一雙雨靴）中，毫不費力地融合各種設計靈感。

致力於保護用戶隱私和圖像完整性

在用戶隱私方面，Google保證，除非作為回饋提供，否則上傳到平台的圖像不會用於其生成式機器學習系統的訓練。此外，所有透過 Gemini 應用程式產生或修改的影像都將獲得可見的浮水印以及不可見的 SynthID 數位浮水印，以維護真實性和版權完整性。

要了解有關 Gemini 2.5 Flash Image 的更多信息，請訪問Neowin上的完整公告。

Google推出 Gemini 2.5 Flash 影像 – 進階影像生成模型

Google發布尖端 Gemini 2.5 Flash 影像模型

提升影像編輯標準

為創意人員和開發者提供無障礙服務

致力於保護用戶隱私和圖像完整性

相關文章:

《戰爭機器：重裝上陣》PC 版評測－視覺吸引力、懷舊感與挫敗感

Google為 Android TV 用戶推出 YouTube Beta 版計劃

發佈留言取消回覆

Google發布尖端 Gemini 2.5 Flash 影像模型

提升影像編輯標準

為創意人員和開發者提供無障礙服務

致力於保護用戶隱私和圖像完整性

相關文章:

發佈留言 取消回覆

發佈留言取消回覆