
Google發布尖端 Gemini 2.5 Flash 影像模型
谷歌取得了重大突破,推出了Gemini 2.5 Flash Image,這是一款革命性的圖像生成和編輯模型,內部稱之為「奈米香蕉」。這款先進的工具旨在產生和修改影像,同時確保字元的一致性,並將各種影像無縫合併為一個連貫的最終結果。
提升影像編輯標準
根據 LMArena 報導,Gemini 2.5 Flash Image 已迅速躋身影像編輯模型的巔峰,超越了 OpenAI 的 GPT Image 1 和 Flux.1 Kontext 等競爭對手。從歷史上看,早期的圖像生成模型在視覺美學方面表現出色,但往往在準確解讀現實世界語義方面有所不足。 Gemini 2.5 模型利用豐富的世界知識,增強了影像輸出的真實感和準確性。
為創意人員和開發者提供無障礙服務
這款最新模型可供消費者和開發者輕鬆使用。對於開發者而言,Gemini 2.5 Flash Image 可透過各種平台使用,包括 Gemini API、Google AI Studio 以及滿足企業級需求的 Vertex AI。其定價為每百萬個輸出代幣 30 美元,平均每張圖片約 0.039 美元。
消費者可以透過 Gemini 網頁和行動應用程式體驗這款創新車型的功能。谷歌重點介紹了一系列變革性用例,用戶可以透過 Gemini 應用程式進行探索:
- 服裝和位置增強:使用者可以上傳自己的照片或寵物的照片,並輕鬆地將它們放置在新的動態設定中,同時保持其原始外觀。
- 照片融合:此模型允許合併多張影像,打造全新場景。例如,您可以將自己的肖像與愛犬的肖像融合,打造籃球場上共同的迷人時刻。
- 迭代編輯:使用者可以進行多輪編輯,從空房間開始,逐步添加牆壁顏色、書架或家具等元素,以創建他們設想的空間。
- 設計融合:使用者可以創意地將一幅圖像的美感(如花卉圖案)應用到另一幅圖像中的物體(如一雙雨靴)中,毫不費力地融合各種設計靈感。
致力於保護用戶隱私和圖像完整性
在用戶隱私方面,Google保證,除非作為回饋提供,否則上傳到平台的圖像不會用於其生成式機器學習系統的訓練。此外,所有透過 Gemini 應用程式產生或修改的影像都將獲得可見的浮水印以及不可見的 SynthID 數位浮水印,以維護真實性和版權完整性。
要了解有關 Gemini 2.5 Flash Image 的更多信息,請訪問Neowin上的完整公告。
發佈留言