Google Gemini 2.5 Deep Think 模型优于 OpenAI O3 和 Gork 4

谷歌发布 Gemini 2.5 Deep Think：AI 能力的一次飞跃

谷歌今天发布重要公告，宣布其 Gemini 2.5 Deep Think 模型已部署于 Gemini 应用程序中，该应用程序仅供 Google AI Ultra 订阅用户使用。这款尖端模型在多个重要基准测试中的表现均超越了包括 OpenAI 的 o3 和 xAI 的 Gork 4 在内的知名竞争对手。

Gemini 2.5 Pro 的进化版

Gemini 2.5 的旅程始于今年 5 月的 Google I/O 2025 大会，当时 Gemini 2.5 Pro Deep Think 模型首次亮相。这款创新模型运用先进的研究方法，在提供响应之前分析各种假设。今天的更新带来了增强的功能，这些功能得益于早期测试人员的宝贵意见以及近期研究的进展。Google 表示，与 I/O 大会上展示的初始版本相比，这些更新标志着一次重大飞跃。

铜牌表演

此外，谷歌透露，最新的 Deep Think 模型是最近在 2025 年国际数学奥林匹克 (IMO) 比赛中获得金牌的版本的变体。然而，为了确保更广泛的适用性，该模型已针对更快的响应速度进行了优化，尽管在 2025 年 IMO 基准测试中获得了铜牌级别的评级。

出色的基准测试结果

正如随附的基准测试所强调的那样，Gemini 2.5 Deep Think 在 LiveCodeBench V6、Humanity’s Last Exam、IMO 2025 和 AIME 2025 等评估中表现出色，展示了其强大的功能。

在 Gemini 应用程序中访问 Deep Think

Google AI Ultra 的订阅用户现在可以通过 Gemini 应用使用 Deep Think，但每日提示次数有限制。用户在使用 Gemini 2.5 Pro 型号时，可以在提示栏中选择“Deep Think”功能。此外，谷歌表示 Deep Think 将与代码执行和谷歌搜索等工具无缝集成。未来几周，谷歌计划通过 Gemini API 向部分值得信赖的开发者推出带工具和不带工具的 Deep Think 版本。

竞争格局

现在的焦点转移到 OpenAI 即将推出的 GPT-5 模型上，这引出了一个关键问题：在即将到来的基准评估中，它是否会超越 Gemini 2.5 Deep Think？

来源和图片

Google Gemini 2.5 Deep Think 模型优于 OpenAI O3 和 Gork 4

谷歌发布 Gemini 2.5 Deep Think：AI 能力的一次飞跃

Gemini 2.5 Pro 的进化版

铜牌表演

出色的基准测试结果

在 Gemini 应用程序中访问 Deep Think

竞争格局

相关文章:

死亡笔记：夜神月本可以扭转命运却未能做到的关键时刻

Nintendo Switch 美国售价上涨，Nintendo Switch 2 价格暂时保持不变

发表回复取消回复

谷歌发布 Gemini 2.5 Deep Think：AI 能力的一次飞跃

Gemini 2.5 Pro 的进化版

铜牌表演

出色的基准测试结果

在 Gemini 应用程序中访问 Deep Think

竞争格局

相关文章:

发表回复 取消回复

发表回复取消回复