首页 > 营销学院 > IT资讯

谷歌AI拿下IMO奥数银牌，数学推理模型AlphaProof面世，强化学习 is so back

对于 ai 来说，奥数不再是问题了。

本周四，谷歌 DeepMind 的人工智能完成了一项壮举：用 AI 做出了今年国际数学奥林匹克竞赛 IMO 的真题，并且距拿金牌仅一步之遥。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

上周刚刚结束的 IMO 竞赛共有六道赛题，涉及代数、组合学、几何和数论。谷歌提出的混合 AI 系统做对了四道，获得 28 分，达到了银牌水平。

本月初，UCLA 终身教授陶哲轩刚刚宣传了百万美元奖金的 AI 数学奥林匹克竞赛（AIMO 进步奖），没想到 7 月还没过，AI 的做题水平就进步到了这种水平。

IMO 上同步做题，做对了最难题

IMO 是历史最悠久、规模最大、最负盛名的青年数学家竞赛，自 1959 年以来每年举办一次。近来，IMO 竞赛也被广泛认为是机器学习领域的一项重大挑战，成为衡量人工智能系统高级数学推理能力的理想基准。

在今年的 IMO 竞赛上，由 DeepMind 团队研发的 AlphaProof 和 AlphaGeometry 2 共同实现了里程碑式的突破。

其中，AlphaProof 是一种用于形式化数学推理的强化学习系统，而 AlphaGeometry 2 是 DeepMind 几何求解系统 AlphaGeometry 的改进版本。

这一突破表明具有先进数学推理能力的通用人工智能 (AGI) 有潜力开启科学技术新领域。

那么，DeepMind 的 AI 系统是如何参加 IMO 竞赛的？

简单来说，首先这些数学问题被手动翻译成形式化的数学语言，以便 AI 系统理解。在正式比赛中，人类参赛选手分两节（两天）提交答案，每节限时 4.5 小时。AlphaProof+AlphaGeometry 2 组合成的 AI 系统在几分钟内就解决了一个问题，但花了三天时间来解决其他问题。虽然如果严格按照规则来说的话，DeepMind 的系统超时了。有人推测，这里面可能涉及大量的暴力破解。

谷歌AI拿下IMO奥数银牌，数学推理模型AlphaProof面世，强化学习 is so back

谷歌表示，AlphaProof 通过确定答案并证明其正确性解决了两道代数问题和一道数论问题。其中包括本次竞赛中最难的问题，在今年的 IMO 上只有五名参赛者解决了。而 AlphaGeometry 2 证明了一道几何问题。

AI 给出的解：https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/imo-2025-solutions/index.html

IMO 金牌得主、菲尔兹奖得主 Timothy Gowers 和两届 IMO 金牌得主、IMO 2025 问题选择委员会主席 Joseph Myers 博士根据 IMO 评分规则，对该组合系统给出的解决方案进行了评分。

六个问题中的每一个问题满分 7 分，总分最高 42 分。DeepMind 的系统最终得分为 28 分，意味着解决的 4 个问题都获得了满分——相当于银牌类别的最高分。今年的金牌门槛为 29 分，正式比赛的 609 名选手中有 58 人获得了金牌。

谷歌AI拿下IMO奥数银牌，数学推理模型AlphaProof面世，强化学习 is so back

该图显示了谷歌 DeepMind 的人工智能系统在 IMO 2025 上相对于人类竞争对手的表现。在总分为 42 分的情况下，该系统获得了 28 分，达到了与比赛银牌获得者相同的水平。另外，今年 29 分是能拿金牌的。

AlphaProof：一种形式化推理方法

在谷歌使用的混合 AI 系统中，AlphaProof 是一个以形式语言 Lean 来证明数学陈述的自训练系统。它结合了预训练语言模型与 AlphaZero 强化学习算法。

其中，形式语言为形式化地验证数学推理证明的正确性，提供了重要优势。在此之前，这在机器学习中的使用一直受限，因为人工编写数据数量非常有限。

相比之下，基于自然语言的方法尽管可以访问更多量级的数据，但会产生看似合理而不正确的中间推理步骤与解法。

谷歌 DeepMind 通过微调 Gemini 模型自动将自然语言问题陈述翻译为形式陈述，在这两个互补领域之间建立了一座桥梁，从而创建了一个包含不同难度形式问题的大型库。

Ghiblio

专业AI吉卜力风格转换平台，将生活照变身吉卜力风格照

157 查看详情 Ghiblio

给到数学问题，AlphaProof 会生成候选解题方案，然后通过搜索 Lean 中可能的证明步骤来证明它们。找到并验证的每个证明方案，都用来强化 AlphaProof 的语言模型，增强其解决后续更具挑战性问题的能力。

为训练 AlphaProof，谷歌 DeepMind 在 IMO 比赛前几周内证明或反证明了涵盖广泛难度与主题的数百万个数学问题。比赛期间还应用了训练 loop，以强化自生成竞赛题变体的证明，直到找到完整的解决方案。

谷歌AI拿下IMO奥数银牌，数学推理模型AlphaProof面世，强化学习 is so back AlphaProof 强化学习训练 loop 过程信息图：约一百万个非形式化数学问题被形式化网络翻译成形式化数学语言。然后，求解器网络搜索问题的证明或反证，通过 AlphaZero 算法逐步训练自己解决更具挑战性的问题。

更具竞争力的 AlphaGeometry 2

AlphaGeometry 2 是今年登上《自然》杂志的数学 AI AlphaGeometry 的重大改进版本。它是一个神经 - 符号混合系统，其中的语言模型基于 Gemini，并在比其前身多一个数量级的合成数据上从头开始训练。这有助于该模型解决更具挑战性的几何问题，包括有关物体运动以及角度、比例或距离方程的问题。

AlphaGeometry 2 采用的符号引擎比上一代产品快两个数量级。当遇到新问题时，新颖的知识共享机制可实现不同搜索树的高级组合，以解决更复杂的问题。

在今年的比赛之前，AlphaGeometry 2 可以解决过去 25 年中所有 IMO 几何历史问题的 83%，而其前身的解决率仅为 53%。在 IMO 2025 中，AlphaGeometry 2 在收到问题 4 的形式化后 19 秒内就解决了它。

谷歌AI拿下IMO奥数银牌，数学推理模型AlphaProof面世，强化学习 is so back

问题 4 的示例，要求证明∠KIL 与∠XPY 的和等于 180°。AlphaGeometry 2 提议在直线 BI 上构造点 E，使得∠AEB = 90°。点 E 有助于赋予线段 AB 中点 L 以意义，从而创建许多对相似三角形，如 ABE ~ YBI 和 ALE ~ IPC，以证明结论。

谷歌 DeepMind 还报告说，作为 IMO 工作的一部分，研究人员还试验了一种基于 Gemini 和一种最新的自然语言推理系统，希望实现高级的问题解决能力。该系统不需要将问题翻译成正式语言，并且可以与其他 AI 系统相结合。在今年的 IMO 赛题的测试中「显示出了巨大的潜力」。

谷歌正在继续探索推进数学推理的 AI 方法，并计划很快发布有关 AlphaProof 的更多技术细节。

我们对未来充满期待，数学家们将使用 AI 工具探索假设，尝试大胆的新方法来解决长期存在的问题，并快速完成耗时的证明元素——而像 Gemini 这样的 AI 系统将在数学和更广泛的推理方面变得更加强大。

研究团队

谷歌表示，新研究得到了国际数学奥林匹克组织的支持，此外：

AlphaProof 的开发由 Thomas Hubert、Rishi Mehta 和 Laurent Sartran 领导；主要贡献者包括 Hussain Masoom、Aja Huang、Miklós Z. Horváth、Tom Zah*y、Vivek Veeriah、Eric Wieser、Jessica Yung、Lei Yu、Yannick Schroecker、Julian Schrittwieser、Ott*ia Bertolli、Borja Ibarz、Edward Lockhart、Edward Hughes、Mark Rowland 和 Grace Margand。

谷歌AI拿下IMO奥数银牌，数学推理模型AlphaProof面世，强化学习 is so back

其中，Aja Huang、Julian Schrittwieser、Yannick Schroecker 等成员也是 8 年前（2016 年）AlphaGo 论文的核心成员。8 年前，他们基于强化学习打造的 AlphaGo 声名大噪。8 年后，强化学习在 AlphaProof 中再次大放异彩。有人在朋友圈感叹说：RL is so back！

谷歌AI拿下IMO奥数银牌，数学推理模型AlphaProof面世，强化学习 is so back

AlphaGeometry 2 和自然语言推理工作由 Thang Luong 领导。AlphaGeometry 2 的开发由 Trieu Trinh 和 Yuri Chervonyi 领导，Mirek Olšák、Xiaomeng Yang、Hoang Nguyen、Junehyuk Jung、Dawsen Hwang 和 Marcelo Menegali 做出了重要贡献。

谷歌AI拿下IMO奥数银牌，数学推理模型AlphaProof面世，强化学习 is so back

此外，D*id Silver、Quoc Le、哈萨比斯和 Pushmeet Kohli 负责协调和管理整个项目。

参考内容：

https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/

以上就是谷歌AI拿下IMO奥数银牌，数学推理模型AlphaProof面世，强化学习 is so back的详细内容，更多请关注其它相关文章！

# 翻译成 # 西餐推广营销策划方案 # 优化网站meta三要素ppt # 元氏智能网站建设资费多少 # 汕头服务网站建设 # 正定seo整站优化价格 # 天津商城网站建设哪家好 # 永川区网络推广营销招聘 # 丹东seo公司平台 # 广告推广的网站哪个好做 # 欧洲网站推广平台有哪些 # 太平洋 # 理论 # 在今年 # 中东 # 解决了 # 出了 # 更具 # 奥林匹克 # 自然语言 # 奥数 # follow # gemini # 谷歌ai

相关栏目：【 Google疑问12 】【 Facebook疑问10 】【优化推广96088 】【技术知识133117 】【 IDC资讯59369 】【网络运营7196 】【 IT资讯61894 】

2024-07-26

Notion AI怎么写笔记 Notion AI辅助写作及自动摘要生成技巧【教学】 AI一键生成高质量论文大纲 Claude帮你改写和润色文章 Claude写作风格优化技巧怎么用ai创作绘本 AI儿童故事与插画自动生成【秘籍】去哪旅行ai抢票助手怎么查看抢票历史_去哪旅行ai抢票助手历史记录查询与筛选【教程】如何用AI一键去除图片背景？AI自动抠图去底最强工具【实测】 DeepSeek数学建模应用指南 DeepSeek解决复杂问题技巧如何用AI一键扩图补全背景？Photoshop AI生成填充使用技巧【教程】 DeepSeek辅助撰写技术文档方法 DeepSeek开发者必备技巧文心一言官方网站在线入口文心一言在线版使用地址 Kimi国内访问入口_Kimi智能助手网页版链接直达如何用AI生成室内设计效果图？AI装修设计灵感生成指南【教程】 AI一键生成社交媒体自动回复蚂蚁阿福官网网页版入口_电脑端使用医保与健康服务如何用AI一键去视频水印 AI视频无痕去水印软件使用方法【教程】 Claude帮你解读晦涩的学术理论 Claude知识学习助手 Jasper AI怎么写社交媒体帖子 Jasper AI社媒内容创作【攻略】 DeepSeek长代码项目理解与分析 DeepSeek代码库学习方法 DeepSeek进行科学计算教程 DeepSeek物理建模与* AI一键生成短视频分镜头脚本

了解您产品搜索量及市场趋势，制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求，1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商，作为谷歌推广与Facebook广告全球合作伙伴，聚焦外贸企业出海痛点，以数字化营销为核心，提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持，打破传统外贸获客壁垒，助力企业高效开拓全球市场，成为中小企业出海的可靠合作伙伴。