来自清华大学的高阳团队在最新一届机器人顶级会议 corl 2025(conference on robot learning)中荣获 x-embodiment workshop 最佳论文奖。
CoRL 是全球机器人学习领域的顶级学术会议,每年汇聚来自全球顶尖学府的创新研究,评选出的最佳论文通常代表着前沿技术与重大突破。
清华团队此次获奖的论文标题为《Data Scaling Laws in Imitation Learning for Robotic Manipulation》,关注的是数据规模定律在机器人操作中的模仿学习中的应用,尤其是能否通过适当的数据规模来实现零样本泛化。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

研究团队收集了超过 40,000 次演示,并进行了 15,000 多次机器人实测。结果表明,策略的泛化能力主要依赖于环境和对象的多样性,而非单纯的演示数量。
在此基础上,他们设计了一种高效的数据收集方案,仅需四个采集者花一下午便能获取足够数据,使两个任务在新环境和新对象上的成功率达到约 90%。
随后,团队将机器人部署在各种野外环境中,包括火锅店、咖啡馆、电梯、喷泉和其他以前未收集数据的地方。结果显示,模型在这些全新的环境中展现出极好的泛化能力,超出预期。
这篇论文的作者是来自清华大学交叉信息研究院的高阳和他的学生林凡淇、胡英东、盛平岳、Chuan Wen、游嘉诚,其中林凡淇、胡英东、Chuan Wen 同属于上海期智学院和上海人工智能实验室。
论文链接:https://data-scaling-laws.github.io/paper.pdf
项目网址:https://data-scaling-laws.github.io/
代码:https://github.com/Fanqi-Lin/Data-Scaling-Laws
数据:https://huggingface.co/datasets/Fanqi-Lin/Processed-Task-Dataset/tree/main
研究团队选择使用手持夹持器(UMI)在不同环境中收集人类演示数据,并使用扩散策略(Diffusion Policy)对数据进行建模,主要研究了策略的泛化性能如何随着训练环境数量、物体数量和演示数量的变化而变化。
实验选择了 Pour Water(倒水)和 Mouse Arrangement(鼠标移动)作为案例研究任务,并在此基础上扩展到 Fold Towels(叠毛巾)和 Unplug Charger(拔掉充电器)任务,收集了超过 40,000 次演示,并在超过 15,000 次实际机器人操作中进行了评估。

具体的实验任务分为对象泛化、环境泛化以及跨环境和对象泛化三种类型,分别针对同一环境下的不同物体、不同环境下的同一物体和不同环境下的不同物体收集演示,随机选择部分演示进行训练,并评估策略在未知情况下的的表现。每个实验设置下,策略在 8 个未见过的环境中进行评估,每个环境有 5 次试验。

实验结果表明,策略的泛化能力与训练物体数量、环境数量和训练环境-物体对数关系密切,符合幂律分布。
对象泛化
随着训练物体数量的增加,策略在未见过的物体上的表现显著提高。当训练物体数量达到 32 时,策略在未见过的物体上的表现超过了 0.9。

环境泛化
增加训练环境数量显著提高了策略在未见过的环境上的表现。即使演示数量保持不变,环境扩展仍然有效。

跨环境和对象泛化
同时增加环境和物体数量显著提高了策略的泛化能力。与单独扩展环境或物体相比,同时扩展两者的效果更好,且额外的演示对性能的提升更快饱和。


林凡淇,清华大学交叉信息研究院 (IIIS) 的一年级博士生,指导老师是高阳教授。此前在清华大学计算机科学与技术系获得学士学位。
他的研究重点是 Embodied AI(具身智能),这是一个集成机器人、计算机视觉和自然语言处理的跨学科领域。具体来说,他的目标是使机器人能够通过大规模数据实现人类水平的操作能力。同时,他还热衷于利用基础模型来增强机器人的能力。
Tunee AI
新一代AI音乐智能体
1104
查看详情

胡英东,清华大学交叉信息研究院 (IIIS) 的四年级博士生,指导老师是高阳教授。此前在北京邮电大学 (BUPT) 获得学士学位。
他的研究重点也是具
身智能,他研究了开发通用机器人系统的基本挑战,这些系统可以在各种非结构化的现实世界环境中有效地适应和推广其学习行为。

盛平岳,清华大学交叉信息科学研究院 (IIIS) 姚班的一名本科生。他的研究兴趣集中在机器人技术、模仿学习和算法上。

Chuan Wen,清华大学交叉信息科学研究院 (IIIS) 的博士生,指导老师是高阳教授,同时与宾夕法尼亚大学 GRASP 实验室的 Dinesh Jayaraman 教授密切合作。此前在上海交通大学电子工程系获得学士学位,师从张亚教授和王新兵教授。他目前还是伯克利人工智能研究 (BAIR) 的访问学者,由 Pieter Abbeel 教授和林星宇博士指导。
游嘉诚,清华大学交叉信息研究院 (IIIS) 的一年级博士生。

高阳,上海期智研究院 PI,清华大学交叉信息研究院助理教授。于美国加州大学伯克利分校获得博士学位,师从 Trevor Darrell 教授。在获得博士学位后,于加州伯克利大学与 Pieter Abbeel 等人合作完成了博士后研究。研究方向为强化学习与机器人。
高阳博士目前主持具身视觉与机器人实验室 (Embodied Vision and Robotics,简称EVAR Lab),专注于利用人工智能技术赋能机器人,致力于打造通用的具身智能框架。
本次 CoRL 2025 也已经宣布了最佳论文的获奖名单,分别为来自 Kuo-Hao Zeng 等人的《PoliFormer: Scaling On-Policy RL with Transformers Results in Masterful N*igators》,和来自 Franck Djeumou 等人的《One Model to Drift Them All》。
论文作者:Kuo-Hao Zeng, Zichen Zhang, Kiana Ehsani, Rose Hendrix, Jordi Salvador, Alvaro Herrasti, Ross Girshick, Aniruddha Kembh*i, Luca Weihs

论文摘要:研究团队提出了 POLIFORMER(Policy Transformer),这是一个仅使用 RGB 的室内导航代理,通过端到端的强化学习在规模上进行训练,并且能够在没有适应的情况下泛化到现实世界。
POLIFORMER 使用了一个基础的视频变压器编码器和因果变压器解码器,实现了长期记忆和推理能力。它经过数亿次交互,在各种环境中进行了训练,利用并行化和多机部署以实现高效训练和高吞吐量。

POLIFORMER 是一个精通的导航器,在两个不同的实施例中——LoCoBot 和 Stretch RE-1机 器人,以及四个导航基准测试中都产生了最先进的结果。它突破了以往工作的局限,实现了 CHORES-S 基准测试中前所未有的 85.5% 的成功率,绝对成功率提高了 28.5%。
POLIFORMER 还可以轻松扩展到多种下游应用,如物体跟踪、多对象导航和开放词汇导航,无需微调。
论文作者:Franck Djeumou, Thomas Jonathan Lew, NAN DING, Michael Thompson, Makoto Suminaka, Marcus Greiff, John Subosits

论文摘要:如果使自动驾驶车辆能够在轮胎力饱和的极限条件下可靠运行,将提高它们的安全性,特别是在紧急避障或恶劣天气等场景中。然而,解锁这一能力由于任务的动态本质和对道路、车辆及其动态相互作用的不确定属性的高敏感性而具有挑战性。
受到这些挑战的启发,研究团队提出了一个框架,利用包含不同环境中不同车辆轨迹的无标签数据集,学习用于高性能车辆控制的条件扩散模型。
研究团队设计的扩散模型能通过物理信息驱动的动力学模型的多模态参数分布来捕捉复杂数据集的轨迹分布。通过在生成过程中进行在线测量,将扩散模型集成到实时模型预测控制框架中,用于在极限条件下驾驶,并展示了它能够即时适应给定的车辆和环境。

在丰田Supra和Lexus LC 500上的广泛实验表明,单个扩散模型在操作时能够在不同轮胎和不同道路条件下可靠地实现自动驾驶漂移。
该模型在特定任务上的专家模型的性能匹配,同时在泛化到未见条件方面表现优于它们,为自动驾驶在处理极限下的通用、可靠方法铺平了道路。PHP中文网(公众号:PHP中文网)PHP中文网
以上就是清华大学获X-Embodiment最佳论文奖,机器人顶会CoRL 2025获奖名单出炉的详细内容,更多请关注其它相关文章!
# iphone
# git
# 上海
# 等人
# 中文网
# 见过
# 名单出炉
# 清华大学
# 机器人技术
# ai
# iis
# 潜江seo推广机构排名
# 渭南网站优化排名案例
# 北京怎样做seo
# 松原外贸网站推广电话是多少
# 煎饼的推广营销
# 网站推广的常用途径
# 网站运营推广心得
# 中国行业数据网站建设
# 转让域名好做吗网站推广
# 个人纹绣营销推广直播
# 指导老师
# 此前
# 学士学位
# 进行了
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
优化推广96088 】
【
技术知识133117 】
【
IDC资讯59369 】
【
网络运营7196 】
【
IT资讯61894 】
相关推荐:
谷歌在人工智能领域没有“护城河”?
AI大模型火了!科技巨头纷纷加入,多地政策加码加速落地
掌阅科技对话式AI应用“阅爱聊”开启内测
山东机器人编程:Scratch编程基础,认识舞台!~济南机器人编程
外科医生的智能助手,“机器人手术”得到补充商业医保覆盖
午报 | 字节跳动要造机器人;东方甄选首次启动自有APP|直播|
人工智能领域,突破难题:国产大模型“无源之水”问题得到解决。
行业首发「超级智绘」AI故事集,TCL实业推进AI技术应用
Gartner发布中国企业人工智能趋势浪潮3.0
Snap宣布研发出新技术 可大幅提升AI生成图像速度
《上古卷轴5》AI高清材质包优化游戏中所有怪物
北交大推出国内首个开源交通大模型TransGPT,可免费商用
彬州市第三届青少年机器人创新大赛成功举办
全球首款AI裸眼3D平板 国产的售价破万
Databricks 发布大数据分析平台 Spark 用 AI 模型 SDK:一键生成 SQL 及 FySpark 语言图表代码
自然语言生成在智能家居设备中的应用
WPS AI 官网上线:可申请体验官资格,支持 Windows、安卓端下载
将上下文长度扩展到256k,无限上下文版本的LongLLaMA来了?
美版贴吧8000小组自爆停摆!拒绝数据被谷歌OpenAI白嫖,CEO被网友骂翻:背刺第三方应用
苹果AIGC专利:可通过语音指令生成AR/VR虚拟场景
Xreal AR 眼镜用投屏盒子 Beam 发布:分体式设计,到手 699 元
6月14日《星空下的对话》 张朝阳陆川将畅聊人生、电影、心理学与AI
Meta Quest订阅服务每月7.99美元畅玩两款VR游戏应用
网易易盾 AI Lab 论文入选 ICASSP 2025!黑科技让语音识别越“听”越准
网易数帆以AI融合创新引领数据分析与软件开发新趋势
13条咒语挖掘GPT-4最大潜力,Github万星AI导师火了,网友:隔行再也不隔山了
联通发布鸿湖图文AI大模型1.0,可实现以文生图
人工智能助力精准学习,猿辅导小猿学练机满足学生个性化学习需求
人工智能和神经网络有什么联系与区别?
标贝科技亮相国际顶会ICASSP2025 加速布局海外AI数据市场
“木头姐”:特斯拉的人工智能训练——“赢家通吃”的机会
人工智能在商业中的风险和局限性
值得买科技入选“北京市通用人工智能产业创新伙伴计划”应用伙伴
马斯克发推讽刺人工智能,机器学习本质是统计?
「电子果蝇」惊动马斯克!背后是13万神经元全脑图谱,可在电脑上运行
测试框架-安全和自动驾驶
普林斯顿Infinigen矩阵开启!AI造物主100%创造大自然,逼真到炸裂
张朝阳与陆川谈AI:ChatGPT是鹦鹉学舌思维,不可能取代人类 | 把脉AI大模型
"探索Meta发布的Quest MR/VR视频录制与拍摄指南"
IBM将模拟计算用于人工智能,重塑AI计算
马斯克称未来机器人数量将多于人类,特斯拉愿共享自动驾驶技术
从医疗康复外骨骼到通用人形机器人,傅利叶智能推动核心技术升级
插画师对AI绘画软件的态度是怎样的?
彭博社:苹果Vision Pro曾测试VR手柄追踪方案
无需照相馆,AI证件照生成软件即将推出
“世界上最像人的机器人”接入 Stable Diffusion ,现场完成作画
世界人工智能大会(WAIC 2025)点燃魔都,博尔捷数字科技携前沿技术产品亮相
学生作文评分的新趋势:教师与AI的合作模式
人工智能在项目管理中的作用
首部国内AI辅助动画片《魔游纪:人工智能辅助篇》预告发布
2025-01-08
运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。