对于 ai 来说,奥数不再是问题了。
本周四,谷歌 DeepMind 的人工智能完成了一项壮举:用 AI 做出了今年国际数学奥林匹克竞赛 IMO 的真题,并且距拿金牌仅一步之遥。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

上周刚刚结束的 IMO 竞赛共有六道赛题,涉及代数、组合学、几何和数论。谷歌提出的混合 AI 系统做对了四道,获得 28 分,达到了银牌水平。
本月初,UCLA 终身教授陶哲轩刚刚宣传了百万美元奖金的 AI 数学奥林匹克竞赛(AIMO 进步奖),没想到 7 月还没过,AI 的做题水平就进步到了这种水平。
IMO 上同步做题,做对了最难题
IMO 是历史最悠久、规模最大、最负盛名的青年数学家竞赛,自 1959 年以来每年举办一次。近来,IMO 竞赛也被广泛认为是机器学习领域的一项重大挑战,成为衡量人工智能系统高级数学推理能力的理想基准。
在今年的 IMO 竞赛上,由 DeepMind 团队研发的 AlphaProof 和 AlphaGeometry 2 共同实现了里程碑式的突破。
其中,AlphaProof 是一种用于形式化数学推理的强化学习系统,而 AlphaGeometry 2 是 DeepMind 几何求解系统 AlphaGeometry 的改进版本。
这一突破表明具有先进数学推理能力的通用人工智能 (AGI) 有潜力开启科学技术新领域。
那么,DeepMind 的 AI 系统是如何参加 IMO 竞赛的?
简单来说,首先这些数学问题被手动翻译成形式化的数学语言,以便 AI 系统理解。在正式比赛中,人类参赛选手分两节(两天)提交答案,每节限时 4.5 小时。AlphaProof+AlphaGeometry 2 组合成的 AI 系统在几分钟内就解决了一个问题,但花了三天时间来解决其他问题。虽然如果严格按照规则来说的话,DeepMind 的系统超时了。有人推测,这里面可能涉及大量的暴力破解。

谷歌表示,AlphaProof 通过确定答案并证明其正确性解决了两道代数问题和一道数论问题。其中包括本次竞赛中最难的问题,在今年的 IMO 上只有五名参赛者解决了。而 AlphaGeometry 2 证明了一道几何问题。
AI 给出的解:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/imo-2025-solutions/index.html
IMO 金牌得主、菲尔兹奖得主 Timothy Gowers 和两届 IMO 金牌得主、IMO 2025 问题选择委员会主席 Joseph Myers 博士根据 IMO 评分规则,对该组合系统给出的解决方案进行了评分。
六个问题中的每一个问题满分 7 分,总分最高 42 分。DeepMind 的系统最终得分为 28 分,意味着解决的 4 个问题都获得了满分——相当于银牌类别的最高分。今年的金牌门槛为 29 分,正式比赛的 609 名选手中有 58 人获得了金牌。

该图显示了谷歌 DeepMind 的人工智能系统在 IMO 2025 上相对于人类竞争对手的表现。在总分为 42 分的情况下,该系统获得了 28 分,达到了与比赛银牌获得者相同的水平。另外,今年 29 分是能拿金牌的。
AlphaProof:一种形式化推理方法
在谷歌使用的混合 AI 系统中,AlphaProof 是一个以形式语言 Lean 来证明数学陈述的自训练系统。它结合了预训练语言模型与 AlphaZero 强化学习算法。
其中,形式语言为形式化地验证数学推理证明的正确性,提供了重要优势。在此之前,这在机器学习中的使用一直受限,因为人工编写数据数量非常有限。
相比之下,基于自然语言的方法尽管可以访问更多量级的数据,但会产生看似合理而不正确的中间推理步骤与解法。
谷歌 DeepMind 通过微调 Gemini 模型自动将自然语言问题陈述翻译为形式陈述,在这两个互补领域之间建立了一座桥梁,从而创建了一个包含不同难度形式问题的大型库。
Ghiblio
专业AI吉卜力风格转换平台,将生活照变身吉卜力风格照
157
查看详情
给到数学问题,AlphaProof 会生成候选解题方案,然后通过搜索 Lean 中可能的证明步骤来证明它们。找到并验证的每个证明方案,都用来强化 AlphaProof 的语言模型,增强其解决后续更具挑战性问题的能力。
为训练 AlphaProof,谷歌 DeepMind 在 IMO 比赛前几周内证明或反证明了涵盖广泛难度与主题的数百万个数学问题。比赛期间还应用了训练 loop,以强化自生成竞赛题变体的证明,直到找到完整的解决方案。
AlphaProof 强化学习训练 loop 过程信息图:约一百万个非形式化数学问题被形式化网络翻译成形式化数学语言。然后,求解器网络搜索问题的证明或反证,通过 AlphaZero 算法逐步训练自己解决更具挑战性的问题。
更具竞争力的 AlphaGeometry 2
AlphaGeometry 2 是今年登上《自然》杂志的数学 AI AlphaGeometry 的重大改进版本。它是一个神经 - 符号混合系统,其中的语言模型基于 Gemini,并在比其前身多一个数量级的合成数据上从头开始训练。这有助于该模型解决更具挑战性的几何问题,包括有关物体运动以及角度、比例或距离方程的问题。
AlphaGeometry 2 采用的符号引擎比上一代产品快两个数量级。当遇到新问题时,新颖的知识共享机制可实现不同搜索树的高级组合,以解决更复杂的问题。
在今年的比赛之前,AlphaGeometry 2 可以解决过去 25 年中所有 IMO 几何历史问题的 83%,而其前身的解决率仅为 53%。在 IMO 2025 中,AlphaGeometry 2 在收到问题 4 的形式化后 19 秒内就解决了它。

问题 4 的示例,要求证明∠KIL 与∠XPY 的和等于 180°。AlphaGeometry 2 提议在直线 BI 上构造点 E,使得∠AEB = 90°。点 E 有助于赋予线段 AB 中点 L 以意义,从而创建许多对相似三角形,如 ABE ~ YBI 和 ALE ~ IPC,以证明结论。
谷歌 DeepMind 还报告说,作为 IMO 工作的一部分,研究人员还试验了一种基于 Gemini 和一种最新的自然语言推理系统,希望实现高级的问题解决能力。该系统不需要将问题翻译成正式语言,并且可以与其他 AI 系统相结合。在今年的 IMO 赛题的测试中「显示出了巨大的潜力」。
谷歌正在继续探索推进数学推理的 AI 方法,并计划很快发布有关 AlphaProof 的更多技术细节。
我们对未来充满期待,数学家们将使用 AI 工具探索假设,尝试大胆的新方法来解决长期存在的问题,并快速完成耗时的证明元素——而像 Gemini 这样的 AI 系统将在数学和更广泛的推理方面变得
更加强大。
研究团队
谷歌表示,新研究得到了国际数学奥林匹克组织的支持,此外:
AlphaProof 的开发由 Thomas Hubert、Rishi Mehta 和 Laurent Sartran 领导;主要贡献者包括 Hussain Masoom、Aja Huang、Miklós Z. Horváth、Tom Zah*y、Vivek Veeriah、Eric Wieser、Jessica Yung、Lei Yu、Yannick Schroecker、Julian Schrittwieser、Ott*ia Bertolli、Borja Ibarz、Edward Lockhart、Edward Hughes、Mark Rowland 和 Grace Margand。

其中,Aja Huang、Julian Schrittwieser、Yannick Schroecker 等成员也是 8 年前(2016 年)AlphaGo 论文的核心成员。8 年前,他们基于强化学习打造的 AlphaGo 声名大噪。8 年后,强化学习在 AlphaProof 中再次大放异彩。有人在朋友圈感叹说:RL is so back!

AlphaGeometry 2 和自然语言推理工作由 Thang Luong 领导。AlphaGeometry 2 的开发由 Trieu Trinh 和 Yuri Chervonyi 领导,Mirek Olšák、Xiaomeng Yang、Hoang Nguyen、Junehyuk Jung、Dawsen Hwang 和 Marcelo Menegali 做出了重要贡献。

此外,D*id Silver、Quoc Le、哈萨比斯和 Pushmeet Kohli 负责协调和管理整个项目。
参考内容:
https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/
以上就是谷歌AI拿下IMO奥数银牌,数学推理模型AlphaProof面世,强化学习 is so back的详细内容,更多请关注其它相关文章!
# 翻译成
# 西餐推广营销策划方案
# 优化网站meta三要素ppt
# 元氏智能网站建设资费多少
# 汕头服务网站建设
# 正定seo整站优化价格
# 天津商城网站建设哪家好
# 永川区网络推广营销招聘
# 丹东seo公司平台
# 广告推广的网站哪个好做
# 欧洲网站推广平台有哪些
# 太平洋
# 理论
# 在今年
# 中东
# 解决了
# 出了
# 更具
# 奥林匹克
# 自然语言
# 奥数
# follow
# gemini
# 谷歌ai
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
优化推广96088 】
【
技术知识133117 】
【
IDC资讯59369 】
【
网络运营7196 】
【
IT资讯61894 】
相关推荐:
探索人工智能和物联网的动态融合
苹果2万5的AR遭遇砍单95%:不及预期
有远见!华为四年前注册商标Vision Pro:苹果AR国内要改名
人形机器人打开精密齿轮市场全新空间!受益上市公司梳理
利用AI探索抗体“钥匙”、加速药物研发——访百图生科团队
MetaGPT AI 模型开源:可模拟软件公司开发过程,生成高质量代码
消息称 Meta Quest 将推 VR 游戏订阅:每月 7.99 美元,任选两款
视觉中国推出付费AI绘图功能:无版权可用
马斯克回应“人工智能让一切变得更好”:我们已经是半机器人了
用AI技术点亮老照片:Deep Nostalgia带给照片新生动感
鉴智机器人发布基于地平线征程5的标准视觉感知产品
“技术+实践+生态”三箭齐发,京东方抢占物联网高地
DragGAN开源三天Star量23k,这又来一个DragDiffusion
大型无人机FH-98国内首次夜航转场成功
李开复:未来几年,人工智能会革了所有人的命,除非你这么做
2025“春晖杯”人工智能专场对接活动举办
小米首次曝光 64 亿参数的 MiLM-6B AI 大模型,或将应用于小爱同学
华为盘古AI模型实现秒级全球气象预报时间缩短
美图公司吴欣鸿:AI技术重构影像产业
智能技术提高现代商业运营的7七种方式
爱设计 AI 一键生成 PPT 工具上线:输入标题即可生成 PPT
一句话搞定数据分析,浙大全新大模型数据助手,连搜集都省了
搭载星火认知大模型 讯飞听见智慧屏开启AI办公新体验
人工智能在商业中的风险和局限性
谷歌将使用公开信息训练 AI 模型,构建更强大的自家产品
中科院自研新一代 AI 大模型“紫东太初 2.0”问世
网易云音乐和小冰推出AI歌手音乐创作软件,首发内置12名AI歌手
这效果能打几分?AI真人化《名侦探柯南》
Snow Kylin登陆中国列车,打造全球首条元宇宙专列
重磅! 捷通华声灵云AICC荣获第二届光合组织AI解决方案大赛二等奖
生成式人工智能来了,如何保护未成年人? | 社会科学报
谷歌旗下 DeepMind 开发出 RoboCat AI 模型,能控制多种机器人执行一系列任务
AI 模型 Stable Diffusion 升级:正常生成五指、图像更逼真
贫穷让我预训练
Meta 开源 AI 语言模型 MusicGen,可将文本和旋律转化为完整乐曲
提高开发效率:AmazonCodeWhisperer与Amazon Glue的集成和生成式AI的应用
城市在采用人工智能方面进展如何?
生成式AI与云结合,机遇与挑战并存
AI数字人业务频频获点赞,谦寻积极引领示范作用
一文看懂基础模型的定义和工作原理
人工智能“Aria”现身 Opera浏览器100版本更新:新功能“标签岛”
标小智LOGO推出AI公司起名生成器“Name.GPT”
讯飞星火大模型实现升级 助力通用人工智能人才培养
RoboNeo操作教程
“风乌”气象大模型科学家团队:用AI预报极端天气未来不是梦!
谷歌计划在上海举办开发者大会,重点关注机器学习和生成式AI领域
朱民:普通人炒股炒不过机器人是很正常的 AI已经能理解市场情绪
苹果机器学习关键人物 Ali Farhadi 离职,回归 AI2 担任 CEO
数据显示:人工智能相关专业热度上升最快 考古、美术、生物医学工程等小众专业火了
构建AI绘画网站的方法:使用API接口和调用步骤
2024-07-26
运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。