
Google今日發布了增強版 Gemini 2.5 模型,展示了其在多個重要 AI 基準測試中顯著的效能提升。這家科技巨頭特別強調,全新的 Gemini 2.5 Preview 06-05「思考」模型在編碼、數學、科學和邏輯推理等關鍵領域表現出色。
我們最新的 Gemini 2.5 Pro 更新現已推出預覽版。 它在編碼、推理、科學和數學方面表現更佳,在關鍵基準測試(AIDER Polyglot、GPQA、HLE 等)中表現出色,並且領先於@lmarena_ai,Elo 分數較上一版本提升了 24 分。 我們也… pic.twitter.com/SVjdQ2k1tJ
– Sundar Pichai (@sundarpichai) 2025 年 6 月 5 日
此次發布是基於上個月 Google I/O 大會上發布的 Gemini 2.5 Pro 型號的初始升級版本。最新版本不僅提升了基準測試分數,還採納了使用者回饋,改進了回應的風格和結構元素,從而為使用者帶來更具創意、格式更清晰的輸出。
下面,您將看到與其他領先的 AI 模型的基準比較分析。

附表顯示,Gemini 2.5 Pro 預覽版模型目前在 AIDER Polyglot 等編碼基準測試中達到了 SOTA 水準。此外,它在 GPQA 和 Humanity’s Last Exam (HLE) 基準測試中也達到了 SOTA 水平,這兩個基準測試評估的是數學、科學、常識和推理能力。值得注意的是,在實際測試中,最新的 2.5 Pro 模型在 LMArena 上提升了 24 分,在 WebDevArena 上顯著提升了 35 分,達到了 1443 分。
有興趣使用這款先進的 Gemini 2.5 Pro 預覽模型的開發者,可以透過 Google AI Studio 和 Vertex AI 提供的 Gemini API 存取該模型。此外,普通用戶也可以透過 Gemini 應用程式存取該模型。谷歌已確認,Gemini 2.5 Pro 模型將在幾週內全面上市,為在生產過程中整合到企業級應用程式中鋪平道路。
發佈留言