Google Gemini 與 OpenAI 競爭，在數學奧林匹克競賽中取得“金牌標準”

國際數學奧林匹克：一項頂尖挑戰

國際數學奧林匹克（IMO）是全球最受尊敬的青少年數學競賽之一。每年，來自每個參賽國的六名大學預科生齊聚一堂，共同解決六道極其複雜的數學難題。僅有8%的參賽者能夠憑藉其傑出的解決方案獲得金牌。

國際海事組織 (IMO) 上的人工智慧競賽：OpenAI 對陣 Google

今年的國際海事組織（IMO）帶來了現代氣息，領先的科技巨頭OpenAI和谷歌帶著其先進的語言學習模型（LLM）加入競爭。上週末，OpenAI宣布了一項令人矚目的成就，聲稱其實驗推理LLM模型的表現達到了通常只有金牌得主才能達到的水平。為了驗證這一點，OpenAI在2025年IMO的題目上測試了其模型，嚴格遵循與人類選手相同的條件。此模型需要在兩個4.5小時的考試環節中，在沒有外部工具或網路存取的情況下解決複雜問題，並負責建構自然語言證明。

我們憑藉通用推理法學碩士學位在 2025 年國際數學奧林匹克競賽中取得了金牌級別的成績🥇！我們的模型解決了世界級的數學難題，達到了人類頂尖選手的程度。這是人工智慧和數學史上的一個重要里程碑。 https ://t.co/u2RlFFavyT

— OpenAI (@OpenAI) 2025 年 7 月 19 日

Google Gemini Deep Think：強勁競爭者

同時，Google近期宣布其先進的 Gemini Deep Think 模型成功解決了 IMO 六道題目中的五道，其性能也達到了金牌水平。 Gemini 的增強版整合了Google最新研究突破中的尖端推理模式，包括能夠同時探索多種問題解決路徑（而非傳統的順序方法）的技術。

根據 Google DeepMind 團隊介紹，Gemini Deep Think 的進步非常顯著：

為了充分利用 Deep Think 的推理能力，我們額外對 Gemini 進行了新的強化學習技術訓練，使其能夠利用更多多步驟推理、問題求解和定理證明資料。我們也為 Gemini 提供了精選的高品質數學題庫，並在其指令中添加了一些關於如何解答 IMO 題目的通用提示和技巧。

未來將推出的先進模型

谷歌計劃很快將新版 Deep Think 車型推向一組精選的可信賴測試人員。之後，該模型將向 Google AI Ultra 訂閱用戶開放，這標誌著人工智慧在解決複雜數學難題的應用方面邁出了重要一步。

來源和圖片

Google Gemini 與 OpenAI 競爭，在數學奧林匹克競賽中取得“金牌標準”

國際數學奧林匹克：一項頂尖挑戰

國際海事組織 (IMO) 上的人工智慧競賽：OpenAI 對陣 Google

Google Gemini Deep Think：強勁競爭者

未來將推出的先進模型

相關文章:

谷歌推出OSS Rebuild以應對開源供應鏈安全威脅

《最終告別：愛與深空混沌》中 Sylus 全部結局達成指南

發佈留言取消回覆

國際數學奧林匹克：一項頂尖挑戰

國際海事組織 (IMO) 上的人工智慧競賽：OpenAI 對陣 Google

Google Gemini Deep Think：強勁競爭者

未來將推出的先進模型

相關文章:

發佈留言 取消回覆

發佈留言取消回覆