谷歌推出 Gemini 2.5 Flash 图像 – 高级图像生成模型

谷歌发布尖端 Gemini 2.5 Flash 图像模型

谷歌取得了重大突破，推出了Gemini 2.5 Flash Image，这是一款革命性的图像生成和编辑模型，内部称之为“纳米香蕉”。这款先进的工具旨在生成和修改图像，同时确保字符的一致性，并将各种图像无缝合并为一个连贯的最终结果。

提升图像编辑标准

据 LMArena 报道，Gemini 2.5 Flash Image 已迅速跻身图像编辑模型的巅峰，超越了 OpenAI 的 GPT Image 1 和 Flux.1 Kontext 等竞争对手。从历史上看，早期的图像生成模型在视觉美学方面表现出色，但往往在准确解读现实世界语义方面有所欠缺。Gemini 2.5 模型利用丰富的世界知识，增强了图像输出的真实感和准确性。

为创意人员和开发者提供无障碍服务

这款最新模型可供消费者和开发者轻松使用。对于开发者而言，Gemini 2.5 Flash Image 可通过各种平台使用，包括 Gemini API、Google AI Studio 以及满足企业级需求的 Vertex AI。其定价为每百万个输出代币 30 美元，平均每张图片约 0.039 美元。

消费者可以通过 Gemini 网页和移动应用程序体验这款创新车型的功能。谷歌重点介绍了一系列变革性用例，用户可以通过 Gemini 应用程序进行探索：

服装和位置增强：用户可以上传自己的照片或宠物的照片，并轻松地将它们放置在新的动态设置中，同时保持其原始外观。

照片融合：该模型允许合并多张图像，打造全新场景。例如，您可以将自己的肖像与爱犬的肖像融合，打造篮球场上共同的迷人瞬间。

迭代编辑：用户可以进行多轮编辑，从空房间开始，逐步添加墙壁颜色、书架或家具等元素，以创建他们设想的空间。

设计融合：用户可以创造性地将一幅图像的美感（如花卉图案）应用到另一幅图像中的物体（如一双雨靴）中，毫不费力地融合各种设计灵感。

致力于保护用户隐私和图像完整性

在用户隐私方面，谷歌保证，除非作为反馈提供，否则上传到平台的图像不会用于其生成式机器学习系统的训练。此外，所有通过 Gemini 应用生成或修改的图像都将获得可见的水印以及不可见的 SynthID 数字水印，以维护真实性和版权完整性。

要了解有关 Gemini 2.5 Flash Image 的更多信息，请访问Neowin上的完整公告。

谷歌推出 Gemini 2.5 Flash 图像 – 高级图像生成模型

谷歌发布尖端 Gemini 2.5 Flash 图像模型

提升图像编辑标准

为创意人员和开发者提供无障碍服务

致力于保护用户隐私和图像完整性

相关文章:

《战争机器：重装上阵》PC 版评测——视觉吸引力、怀旧感与挫败感

谷歌为 Android TV 用户推出 YouTube Beta 版计划

发表回复取消回复

谷歌发布尖端 Gemini 2.5 Flash 图像模型

提升图像编辑标准

为创意人员和开发者提供无障碍服务

致力于保护用户隐私和图像完整性

相关文章:

发表回复 取消回复

发表回复取消回复