Google Gemini 與 OpenAI 競爭,在數學奧林匹克競賽中取得“金牌標準”

Google Gemini 與 OpenAI 競爭,在數學奧林匹克競賽中取得“金牌標準”

國際數學奧林匹克:一項頂尖挑戰

國際數學奧林匹克(IMO)是全球最受尊敬的青少年數學競賽之一。每年,來自每個參賽國的六名大學預科生齊聚一堂,共同解決六道極其複雜的數學難題。僅有8%的參賽者能夠憑藉其傑出的解決方案獲得金牌。

國際海事組織 (IMO) 上的人工智慧競賽:OpenAI 對陣 Google

今年的國際海事組織(IMO)帶來了現代氣息,領先的科技巨頭OpenAI和谷歌帶著其先進的語言學習模型(LLM)加入競爭。上週末,OpenAI宣布了一項令人矚目的成就,聲稱其實驗推理LLM模型的表現達到了通常只有金牌得主才能達到的水平。為了驗證這一點,OpenAI在2025年IMO的題目上測試了其模型,嚴格遵循與人類選手相同的條件。此模型需要在兩個4.5小時的考試環節中,在沒有外部工具或網路存取的情況下解決複雜問題,並負責建構自然語言證明。

我們憑藉通用推理法學碩士學位在 2025 年國際數學奧林匹克競賽中取得了金牌級別的成績🥇!我們的模型解決了世界級的數學難題,達到了人類頂尖選手的程度。這是人工智慧和數學史上的一個重要里程碑。 https ://t.co/u2RlFFavyT

— OpenAI (@OpenAI) 2025 年 7 月 19 日

Google Gemini Deep Think:強勁競爭者

同時,Google近期宣布其先進的 Gemini Deep Think 模型成功解決了 IMO 六道題目中的五道,其性能也達到了金牌水平。 Gemini 的增強版整合了Google最新研究突破中的尖端推理模式,包括能夠同時探索多種問題解決路徑(而非傳統的順序方法)的技術。

根據 Google DeepMind 團隊介紹,Gemini Deep Think 的進步非常顯著:

為了充分利用 Deep Think 的推理能力,我們額外對 Gemini 進行了新的強化學習技術訓練,使其能夠利用更多多步驟推理、問題求解和定理證明資料。我們也為 Gemini 提供了精選的高品質數學題庫,並在其指令中添加了一些關於如何解答 IMO 題目的通用提示和技巧。

未來將推出的先進模型

谷歌計劃很快將新版 Deep Think 車型推向一組精選的可信賴測試人員。之後,該模型將向 Google AI Ultra 訂閱用戶開放,這標誌著人工智慧在解決複雜數學難題的應用方面邁出了重要一步。

來源和圖片

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *