
国际数学奥林匹克:一项顶级挑战
国际数学奥林匹克(IMO)是全球最受尊敬的青少年数学竞赛之一。每年,来自每个参赛国的六名大学预科生齐聚一堂,共同解决六道极其复杂的数学难题。仅有8%的参赛者能够凭借其杰出的解决方案获得金牌。
国际海事组织 (IMO) 上的人工智能竞赛:OpenAI 对阵 Google
今年的国际海事组织(IMO)带来了现代气息,领先的科技巨头OpenAI和谷歌携其先进的语言学习模型(LLM)加入竞争。上周末,OpenAI宣布了一项令人瞩目的成就,声称其实验推理LLM模型的表现达到了通常只有金牌得主才能达到的水平。为了验证这一点,OpenAI在2025年IMO的题目上测试了其模型,严格遵循与人类选手相同的条件。该模型需要在两个4.5小时的考试环节中,在没有外部工具或互联网接入的情况下解决复杂问题,并负责构建自然语言证明。
我们凭借通用推理法学硕士学位在 2025 年国际数学奥林匹克竞赛中取得了金牌级别的成绩🥇!我们的模型解决了世界级的数学难题,达到了人类顶尖选手的水平。这是人工智能和数学史上的一座重要里程碑。https ://t.co/u2RlFFavyT
— OpenAI (@OpenAI) 2025 年 7 月 19 日
谷歌 Gemini Deep Think:强劲竞争者
与此同时,谷歌近期宣布其先进的 Gemini Deep Think 模型成功解决了 IMO 六道题目中的五道,其性能也达到了金牌水平。Gemini 的增强版集成了谷歌最新研究突破中的尖端推理模式,包括能够同时探索多种问题解决路径(而非传统的顺序方法)的技术。
据 Google DeepMind 团队介绍,Gemini Deep Think 的进步非常显著:
为了充分利用 Deep Think 的推理能力,我们额外对 Gemini 进行了新的强化学习技术训练,使其能够利用更多多步推理、问题求解和定理证明数据。我们还为 Gemini 提供了精选的高质量数学题库,并在其指令中添加了一些关于如何解答 IMO 题目的通用提示和技巧。
未来将推出的先进模型
谷歌计划很快将新版 Deep Think 模型推向一组精选的可信赖测试人员。之后,该模型将向 Google AI Ultra 订阅用户开放,这标志着人工智能在解决复杂数学难题的应用方面迈出了重要一步。
发表回复