两小时就能超过人类!DeepMind最新AI速通26款雅达利游戏


deepmind的ai智能体,又来卷自己了!

注意看,这个名叫BBF的家伙,只用2个小时,就掌握了26款雅达利游戏,效率和人类相当,超越了自己一众前辈。

要知道,AI智能体通过强化学习解决问题的效果一直都不错,但最大的问题就在于这种方式效率很低,需要很长时间摸索。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

两小时就能超过人类!DeepMind最新AI速通26款雅达利游戏图片

而BBF带来的突破正是在效率方面。

怪不得它的全名可以叫Bigger、Better、Faster。

而且它还能只在单卡上完成训练,算力要求也降低许多。

BBF由谷歌DeepMind和蒙特利尔大学共同提出,目前数据和代码均已开源。

最高可取得人类5倍成绩

用于评价BBF游戏表现的数值,叫做IQM。

IQM是多方面游戏表现的综合得分,本文中的IQM成绩以人类为基准进行了归一化处理。

经与多个前人成果相比较,BBF在包含26款雅达利游戏的Atari 100K测试数据集中取得了最高的IQM成绩。

并且,在训练过的26款游戏中,BBF的成绩已经超过了人类。

与表现相似的Eff.Zero相比,BBF消耗的GPU时间缩短了将近一半。

而消耗GPU时间相似的SPR和SR-SPR,性能又和BBF差了一大截。

两小时就能超过人类!DeepMind最新AI速通26款雅达利游戏图片

而在反复进行的测试中,BBF达到某一IQM分数的比例始终保持着较高水平。

甚至有超过总测试次数1/8的运行当中取得了5倍于人类的成绩。

两小时就能超过人类!DeepMind最新AI速通26款雅达利游戏图片

即使加上其他没有训练过的雅达利游戏,BBF也能取得超过人类一半的分数IQM分数。

而如果单独看未训练的这29款游戏,BBF的得分是人类的四至五成。

两小时就能超过人类!DeepMind最新AI速通26款雅达利游戏图片

以SR-SPR为基础修改

推动BBF研究的问题是,如何在样本量稀少的情况下扩展深度强化学习网络。

ChatGPT Writer ChatGPT Writer

免费 Chrome 扩展程序,使用 ChatGPT AI 生成电子邮件和消息。

ChatGPT Writer 106 查看详情 ChatGPT Writer

为了研究这一问题,DeepMind将目光聚焦在了Atari 100K基准上。

但DeepMind很快发现,单纯增大模型规模并不能提高其表现。

两小时就能超过人类!DeepMind最新AI速通26款雅达利游戏图片

在深度学习模型的设计中,每步更新次数(Replay Ratio,RR)是一项重要参数。

具体到雅达利游戏,RR值越大,模型在游戏中取得的成绩越高。

最终,DeepMind以SR-SPR作为基础引擎,SR-SPR的RR值最高可达16。

而DeepMind经过综合考虑,选择了8作为BBF的RR值。

考虑到部分用户不愿花费RR=8的运算成本,DeepMind同时开发了RR=2版本的BBF

两小时就能超过人类!DeepMind最新AI速通26款雅达利游戏图片

DeepMind对SR-SPR中的多项内容进行修改之后,采用自监管训练得到了BBF,主要包括以下几个方面:

  • 更高的卷积层重置强度:提高卷积层重置强度可以增大面向随机目标的扰动幅度,让模型表现更好并减少损失,BBF的重置强度增加后,扰动幅度从SR-SPR的20%提高到了50%
  • 更大的网络规模:将神经网络层数从3层提高至15层,宽度也增大4倍
  • 更新范围(n)缩小:想要提高模型的表现,需要使用非固定的n值。BBF每4万个梯度步骤重置一次,每次重置的前1万个梯度步骤中,n以指数形式从10下降至3,衰减阶段占BBF训练过程的25%
  • 更大的衰减因子(γ):有人发现增大学习过程中的γ值可以提高模型表现,BBF的γ值从传统的0.97增至0.997
  • 权重衰减:避免过度拟合的出现,BBF的衰减量约为0.1
  • 删除NoisyNet:原始SR-SPR中包含的NoisyNet不能提高模型表现

消融实验结果表明,在每步更新次数为2和8的条件下,上述因素对BBF的表现均有不同程度的影响。

两小时就能超过人类!DeepMind最新AI速通26款雅达利游戏图片

其中,硬复位和更新范围的缩小影响最为显著。

两小时就能超过人类!DeepMind最新AI速通26款雅达利游戏图片

而对于上面两个图中没有提到的NoisyNet,对模型表现的影响则并不显著。

两小时就能超过人类!DeepMind最新AI速通26款雅达利游戏图片

论文地址:https://arxiv.org/abs/2305.19452GitHub项目页:https://github.com/google-research/google-research/tree/master/bigger_better_faster

参考链接:[1]https://www.php.cn/link/69b4fa3be19bdf400df34e41b93636a4

[2]https://www.marktechpost.com/2025/06/12/superhuman-performance-on-the-atari-100k-benchmark-the-power-of-bbf-a-new-value-based-rl-agent-from-google-deepmind-mila-and-universite-de-montreal/

— 完 —

以上就是两小时就能超过人类!DeepMind最新AI速通26款雅达利游戏的详细内容,更多请关注其它相关文章!


# 效率  # 速通  # 就能  # 达利  # 两小时  # 开源  # AI  # 甘肃seo培训代理  # 外贸seo黑帽培训  # 网站优化维护多少钱  # 企业网站建设内容域名  # 短视频推广营销拓客话术  # 天津seo优  # 太仓网站建设方案外包  # 营销网站优化选择  # seo心电图  # 广元做推广的网站多少钱  # 上海  # 万个  # 蒙特利尔  # 解决问题  # 谁能  # 更大 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 优化推广96088 】 【 技术知识133117 】 【 IDC资讯59369 】 【 网络运营7196 】 【 IT资讯61894


相关推荐: 昌吉市利用无人机实现全天候河道动态巡检  行业首发「超级智绘」AI故事集,TCL实业推进AI技术应用  抢占新赛道 加快机器人产业集聚发展  特斯拉人形机器人将于 7 月亮相上海 2025 世界人工智能大会  讯飞星火大模型实现升级 助力通用人工智能人才培养  2025年的网络分区:人工智能和自动化如何改变事物  人形机器人打开精密齿轮市场全新空间!受益上市公司梳理  人工智能产业竞跑“未来赛道” 创新发展放大“赋能”效应  世界人工智能大会上,科大讯飞宣布与华为联手  在心理治疗中用VR技术,治疗成效显著提高  世界人工智能大会高合发表演讲,HiPhi Y即将全球上市  联通发布鸿湖图文AI大模型1.0,可实现以文生图  鸿蒙智能座舱的AI大模型革新,引领智能座舱领域的变革吗?  人工智能加速走进百姓生活:从2025全球人工智能技术大会看行业新趋势  食品分销跨国企业Sysco CIDO:我们的增长秘诀是以IT为中心  特斯拉门店可能启动机器人卖车?也许不是你想的那样  MetaGPT AI 模型开源:可模拟软件公司开发过程,生成高质量代码  XREAL Beam 投屏盒子正式发布:支持“可悬停 AR 空间屏”  科技赋能司法执行 阿里资产免费为全国法院升级VR新服务  苹果2万5的AR遭遇砍单95%:不及预期  跟着AI大热的“光模块”到底是什么?  长宁这家企业在世界人工智能大会上荣获“蓝鼎奖”  AI技术改变*,新骗局来袭,*成功率接近100%  ChatGPT大更新!OpenAI奉上程序员大礼包:API新增杀手级能力还降价,新模型、四倍上下文都来了  GPT-4成功战胜AI-Guardian审核系统:谷歌研究团队的人工智能抵抗人工智能  猿辅导发布最新SaaS业务进展公告:Motiff UI设计工具推出三项新的AI功能  人工智能的变革之路:通过OpenAI的GPT-4漫游  陈根:AI工具为游戏软件实时3D内容助力  聚焦WAIC|AI技术支撑大模型探索未来  【|直播|预告】人工智能高峰论坛将于7月2日13:30准时开播!  人工智能写作检测工具不靠谱,美国宪法竟被认为是机器人写的  掌阅科技对话式AI应用“阅爱聊”开启内测  杀入生成式AI的亚马逊云科技,能否再次生成未来?  首个算网生态体!中国移动元宇宙产业联盟正式成立  Transformer六周年:当年连NeurIPS Oral都没拿到,8位作者已创办数家AI独角兽  Unity 推出面向开发者的 AI 软件市场 AI Hub,股价飙涨 15%  Midjourney创始人:AI应该成为人类思想的延伸  新华全媒+|AI:当心,我可能欺骗了你!  当一个网站的内容被 AI 完全接管  AI 作画工具 Midjourney 推出“pan”功能,可平移扩展图片外场景  苹果推出全新沉浸式 AR 体验应用“Deep Field”  人工智能产业协同创新中心:全产业链资源在这里汇聚  黄仁勋:5年前,我们对AI抱有巨大期望  引领AI变革,九章云极DataCanvas公司重磅发布AIFS+DataPilot  推动企业数字化转型升级!“松江智造”摘世界人工智能大会重磅奖项  AI大模型时代,数据存储新基座助推教科研数智化跃迁  人工智能进入绿植界,智能庭院市场初具规模  会模仿笔迹的AI,为你创造专属字体  马斯克的幽默“现实”:AR眼镜与20美元“增强现实”哪个真实?  全国青少年无人机大赛重庆市选拔赛开赛 1252名中小学生参加 

 2023-07-03

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司


运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。

 8156699

 13765294890

 8156699@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.