
谷歌推出 Gemini 2.5 Flash 型号,功能增强
上周,在备受期待的 Cloud Next 大会上,谷歌宣布即将推出Gemini 2.5 Flash 模型。这一新版本承诺带来重大改进,现已在 Google AI Studio 和 Vertex AI 环境中通过Gemini API提供预览。Gemini 用户可以使用模型选择器便捷地访问该模型,该选择器与 Canvas 无缝集成,从而增强了文档和代码的优化流程。
相比前代产品有所改进
2.5 版本在其前身Gemini 2.0 Flash的基础上,显著增强了推理能力,同时保持了经济实惠性并最大程度地降低了延迟。据 Google 介绍,这款新型号旨在提供卓越的性价比。以下是定价详情:
- 每 100 万个输入代币 0.15 美元
- 每百万个无推理输出代币收费 0.60 美元
- 每百万个带推理的输出代币收费 3.50 美元
这是 Flash 2.5 的早期版本,但相比 Flash 2.0 版本,它已展现出巨大的优势。 如有需要,您可以完全关闭思考功能,并将此模型作为 Flash 2.0 的直接替代品。 它可在 Gemini API、AI Studio、Vertex 和 Gemini 应用中使用!
— Logan Kilpatrick (@OfficialLoganK) 2025年4月17日
引入混合推理能力
Gemini 2.5 Flash 模型是 Google 首个完全混合推理模型,标志着一个重要的里程碑。它使开发者能够启用或禁用推理功能。这种灵活性使开发者能够优化其应用程序,根据具体项目需求在质量、成本和响应延迟之间进行权衡。

比较性能洞察
如随附的基准测试表所示,尽管成本结构较低,Gemini 2.5 Flash 模型仍能与 Anthropic 和 Grok 的领先模型有效竞争。OpenAI 近期推出的 o4-mini 虽然性能优于 Gemini 2.5 Flash 预览版,但其价格却高出许多,凸显了谷歌产品在当前市场环境下的竞争力。
有关这一突破性模型的更多详细信息和见解,您可以参考原始来源。
发表回复