deepmind的ai智能体,又来卷自己了!
注意看,这个名叫BBF的家伙,只用2个小时,就掌握了26款雅达利游戏,效率和人类相当,超越了自己一众前辈。
要知道,AI智能体通过强化学习解决问题的效果一直都不错,但最大的问题就在于这种方式效率很低,需要很长时间摸索。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
图片
而BBF带来的突破正是在效率方面。
怪不得它的全名可以叫Bigger、Better、Faster。
而且它还能只在单卡上完成训练,算力要求也降低许多。
BBF由谷歌DeepMind和蒙特利尔大学共同提出,目前数据和代码均已开源。
用于评价BBF游戏表现的数值,叫做IQM。
IQM是多方面游戏表现的综合得分,本文中的IQM成绩以人类为基准进行了归一化处理。
经与多个前人成果相比较,BBF在包含26款雅达利游戏的Atari 100K测试数据集中取得了最高的IQM成绩。
并且,在训练过的26款游戏中,BBF的成绩已经超过了人类。
与表现相似的Eff.Zero相比,BBF消耗的GPU时间缩短了将近一半。
而消耗GPU时间相似的SPR和SR-SPR,性能又和BBF差了一大截。
图片
而在反复进行的测试中,BBF达到某一IQM分数的比例始终保持着较高水平。
甚至有超过总测试次数1/8的运行当中取得了5倍于人类的成绩。
图片
即使加上其他没有训练过的雅达利游戏,BBF也能取得超过人类一半的分数IQM分数。
而如果单独看未训练的这29款游戏,BBF的得分是人类的四至五成。
图片
推动BBF研究的问题是,如何在样本量稀少的情况下扩展深度强化学习网络。
ChatGPT Writer
免费 Chrome 扩展程序,使用 ChatGPT AI 生成电子邮件和消息。
106
查看详情
为了研究这一问题,DeepMind将目光聚焦在了Atari 100K基准上。
但DeepMind很快发现,单纯增大模型规模并不能提高其表现。
图片
在深度学习模型的设计中,每步更新次数(Replay Ratio,RR)是一项重要参数。
具体到雅达利游戏,RR值越大,模型在游戏中取得的成绩越高。
最终,DeepMind以SR-SPR作为基础引擎,SR-SPR的RR值最高可达16。
而DeepMind经过综合考虑,选择了8作为BBF的RR值。
考虑到部分用户不愿花费RR=8的运算成本,DeepMind同时开发了RR=2版本的BBF
图片
DeepMind对SR-SPR中的多项内容进行修改之后,采用自监管训练得到了BBF,主要包括以下几个方面:
消融实验结果表明,在每步更新次数为2和8的条件下,上述因素对BBF的表现均有不同程度的影响。
图片
其中,硬复位和更新范围的缩小影响最为显著。
图片
而对于上面两个图中没有提到的NoisyNet,对模型表现的影响则并不显著。
图片
论文地址:https://arxiv.or
g/abs/2305.19452GitHub项目页:https://github.com/google-research/google-research/tree/master/bigger_better_faster
参考链接:[1]https://www.php.cn/link/69b4fa3be19bdf400df34e41b93636a4
[2]https://www.marktechpost.com/2025/06/12/superhuman-performance-on-the-atari-100k-benchmark-the-power-of-bbf-a-new-value-based-rl-agent-from-google-deepmind-mila-and-universite-de-montreal/
— 完 —
以上就是两小时就能超过人类!DeepMind最新AI速通26款雅达利游戏的详细内容,更多请关注其它相关文章!
# 效率
# 速通
# 就能
# 达利
# 两小时
# 开源
# AI
# 甘肃seo培训代理
# 外贸seo黑帽培训
# 网站优化维护多少钱
# 企业网站建设内容域名
# 短视频推广营销拓客话术
# 天津seo优
# 太仓网站建设方案外包
# 营销网站优化选择
# seo心电图
# 广元做推广的网站多少钱
# 上海
# 万个
# 蒙特利尔
# 解决问题
# 谁能
# 更大
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
优化推广96088 】
【
技术知识133117 】
【
IDC资讯59369 】
【
网络运营7196 】
【
IT资讯61894 】
相关推荐:
昌吉市利用无人机实现全天候河道动态巡检
行业首发「超级智绘」AI故事集,TCL实业推进AI技术应用
抢占新赛道 加快机器人产业集聚发展
特斯拉人形机器人将于 7 月亮相上海 2025 世界人工智能大会
讯飞星火大模型实现升级 助力通用人工智能人才培养
2025年的网络分区:人工智能和自动化如何改变事物
人形机器人打开精密齿轮市场全新空间!受益上市公司梳理
人工智能产业竞跑“未来赛道” 创新发展放大“赋能”效应
世界人工智能大会上,科大讯飞宣布与华为联手
在心理治疗中用VR技术,治疗成效显著提高
世界人工智能大会高合发表演讲,HiPhi Y即将全球上市
联通发布鸿湖图文AI大模型1.0,可实现以文生图
鸿蒙智能座舱的AI大模型革新,引领智能座舱领域的变革吗?
人工智能加速走进百姓生活:从2025全球人工智能技术大会看行业新趋势
食品分销跨国企业Sysco CIDO:我们的增长秘诀是以IT为中心
特斯拉门店可能启动机器人卖车?也许不是你想的那样
MetaGPT AI 模型开源:可模拟软件公司开发过程,生成高质量代码
XREAL Beam 投屏盒子正式发布:支持“可悬停 AR 空间屏”
科技赋能司法执行 阿里资产免费为全国法院升级VR新服务
苹果2万5的AR遭遇砍单95%:不及预期
跟着AI大热的“光模块”到底是什么?
长宁这家企业在世界人工智能大会上荣获“蓝鼎奖”
AI技术改变*,新骗局来袭,*成功率接近100%
ChatGPT大更新!OpenAI奉上程序员大礼包:API新增杀手级能力还降价,新模型、四倍上下文都来了
GPT-4成功战胜AI-Guardian审核系统:谷歌研究团队的人工智能抵抗人工智能
猿辅导发布最新SaaS业务进展公告:Motiff UI设计工具推出三项新的AI功能
人工智能的变革之路:通过OpenAI的GPT-4漫游
陈根:AI工具为游戏软件实时3D内容助力
聚焦WAIC|AI技术支撑大模型探索未来
【|直播|预告】人工智能高峰论坛将于7月2日13:30准时开播!
人工智能写作检测工具不靠谱,美国宪法竟被认为是机器人写的
掌阅科技对话式AI应用“阅爱聊”开启内测
杀入生成式AI的亚马逊云科技,能否再次生成未来?
首个算网生态体!中国移动元宇宙产业联盟正式成立
Transformer六周年:当年连NeurIPS Oral都没拿到,8位作者已创办数家AI独角兽
Unity 推出面向开发者的 AI 软件市场 AI Hub,股价飙涨 15%
Midjourney创始人:AI应该成为人类思想的延伸
新华全媒+|AI:当心,我可能欺骗了你!
当一个网站的内容被 AI 完全接管
AI 作画工具 Midjourney 推出“pan”功能,可平移扩展图片外场景
苹果推出全新沉浸式 AR 体验应用“Deep Field”
人工智能产业协同创新中心:全产业链资源在这里汇聚
黄仁勋:5年前,我们对AI抱有巨大期望
引领AI变革,九章云极DataCanvas公司重磅发布AIFS+DataPilot
推动企业数字化转型升级!“松江智造”摘世界人工智能大会重磅奖项
AI大模型时代,数据存储新基座助推教科研数智化跃迁
人工智能进入绿植界,智能庭院市场初具规模
会模仿笔迹的AI,为你创造专属字体
马斯克的幽默“现实”:AR眼镜与20美元“增强现实”哪个真实?
全国青少年无人机大赛重庆市选拔赛开赛 1252名中小学生参加
2023-07-03
运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。