
谷歌发布尖端 Gemini 2.5 Flash 图像模型
谷歌取得了重大突破,推出了Gemini 2.5 Flash Image,这是一款革命性的图像生成和编辑模型,内部称之为“纳米香蕉”。这款先进的工具旨在生成和修改图像,同时确保字符的一致性,并将各种图像无缝合并为一个连贯的最终结果。
提升图像编辑标准
据 LMArena 报道,Gemini 2.5 Flash Image 已迅速跻身图像编辑模型的巅峰,超越了 OpenAI 的 GPT Image 1 和 Flux.1 Kontext 等竞争对手。从历史上看,早期的图像生成模型在视觉美学方面表现出色,但往往在准确解读现实世界语义方面有所欠缺。Gemini 2.5 模型利用丰富的世界知识,增强了图像输出的真实感和准确性。
为创意人员和开发者提供无障碍服务
这款最新模型可供消费者和开发者轻松使用。对于开发者而言,Gemini 2.5 Flash Image 可通过各种平台使用,包括 Gemini API、Google AI Studio 以及满足企业级需求的 Vertex AI。其定价为每百万个输出代币 30 美元,平均每张图片约 0.039 美元。
消费者可以通过 Gemini 网页和移动应用程序体验这款创新车型的功能。谷歌重点介绍了一系列变革性用例,用户可以通过 Gemini 应用程序进行探索:
- 服装和位置增强:用户可以上传自己的照片或宠物的照片,并轻松地将它们放置在新的动态设置中,同时保持其原始外观。
- 照片融合:该模型允许合并多张图像,打造全新场景。例如,您可以将自己的肖像与爱犬的肖像融合,打造篮球场上共同的迷人瞬间。
- 迭代编辑:用户可以进行多轮编辑,从空房间开始,逐步添加墙壁颜色、书架或家具等元素,以创建他们设想的空间。
- 设计融合:用户可以创造性地将一幅图像的美感(如花卉图案)应用到另一幅图像中的物体(如一双雨靴)中,毫不费力地融合各种设计灵感。
致力于保护用户隐私和图像完整性
在用户隐私方面,谷歌保证,除非作为反馈提供,否则上传到平台的图像不会用于其生成式机器学习系统的训练。此外,所有通过 Gemini 应用生成或修改的图像都将获得可见的水印以及不可见的 SynthID 数字水印,以维护真实性和版权完整性。
要了解有关 Gemini 2.5 Flash Image 的更多信息,请访问Neowin上的完整公告。
发表回复