世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果


近日,极佳科技联合中国科学院自动化研究所、理想汽车、北京大学、慕尼黑工业大学等单位提出DriveDreamer4D,是首个利用世界模型增强 4D 驾驶场景重建效果的工作。DriveDreamer4D 可以大幅提升多种自动驾驶 4D 重建算法的效果,在 user study 实验中获得了超过 80% 的偏好投票,为走向空间智能和 4D 世界模型迈出了坚实的一步。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

世界模型新突破!极佳科技提出drivedreamer4d,首次利用世界模型增强4d驾驶场景重建效果

  • 论文链接:https://arxiv.org/abs/2410.13571
  • 项目主页:https://drivedreamer4d.github.io/
  • 代码地址:https://github.com/GigaAI-research/DriveDreamer4D

闭环*技术是推动端到端自动驾驶系统发展的关键。目前的传感器*方法,如 NeRF 与 3DGS,主要依赖于训练数据分布,若训练数据不足,则这些方法在复杂驾驶操作(例如变道、加速或减速)的重建效果不佳。近来,自动驾驶世界模型(World Model)证明其可以生成丰富驾驶数据。在此背景下,本文提出了 DriveDreamer4D,是首个利用世界模型来提升自动驾驶场景 4D 重建质量的算法。

DriveDreamer4D 可以为驾驶场景提供丰富多样的视角(包括变道、加速和减速等)数据,以增加动态驾驶场景下的闭环*能力。

DriveDreamer4D 利用世界模型作为数据引擎,基于真实世界的驾驶数据合成新轨迹视频(例如变道场景)。如下图所示,DriveDreamer4D 不仅可以提升多种重建算法(PVG,S3Gaussian,Deformable-GS)的图像渲染质量,还可以提升驾驶前景(车辆)和背景(车道线)的时空一致性。

世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果

DriveDreamer4D 的总体结构框图如下所示,轨迹生成模块(NTGM)用于调整原始轨迹动作,如转向角度和速度,以生成新的轨迹。这些新轨迹为提取结构化信息(如车辆 3D 框和背景车道线细节)提供了全新的视角。随后,基于世界模型的视频生成能力,并利用更新轨迹后得到的结构化信息作为控制条件,可以合成新轨迹的视频。最后,原始轨迹视频与新轨迹视频相结合,进行 4DGS 模型的优化。

世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果

在实验中,如下第一列视频所示,可以看出多种传统算法(PVG, S3Gaussian,Deformable-GS )在变道场景下的车道线、天空、车辆都会模糊,甚至出现 “鬼影” 现象。而 DriveDreamer4D 可以提升多种重建算法在复杂变道场景下的视频渲染效果,不仅消除了 “鬼影”,而且提升了交通元素的渲染质量,车辆和车道线都更加清晰。世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果除了变道,在车辆变速场景下,传统算法(PVG,S3Gaussian,Deformable-GS)的表现能力也受到限制,如下第一列视频所示,这些算法在自车加速时,前方的车辆都出现了 “拖影” 现象。而经过 DriveDreamer4D 提升后,渲染的车辆的时空一致性更高。 世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果
在定量实验中,本文证明了 DriveDreamer4D 不仅可以提升多种重建算法 (PVG, S3Gaussian,Deformable-GS)的图像渲染质量 (如表 2),还可以提升车辆和车道线渲染的时空一致性(如表 1)。此外,本文还通过 user study(表 3)证明用户更加偏好 DriveDreamer4D 的渲染效果,获得了超过 80% 的投票率。

世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果

Remover Remover

几秒钟去除图中不需要的元素

Remover 304 查看详情 Remover
                                 表 1 DriveDreamer4D 提升了车辆和车道线重建渲染的时空一致性

世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果

                                                             表 2 DriveDreamer4D 提升了图像重建渲染质量

世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果

                                   表 3 User study 证明用户更加偏好 DriveDreamer4D 的渲染效果

本项 DriveDreamer4D 工作是极佳科技研究团队之前 DriveDreamer 和 DriveDreamer-2 工作的延续。

DriveDreamer 是首个面向真实驾驶场景的世界模型,可以根据不同的控制条件生成自动驾驶周视视频,有效提升了 BEV 感知的性能;DriveDreamer-2 在此基础上,引入大语言模型,可以生成用户自定义的驾驶数据,进一步提升了长尾和 corner case 场景下的数据生成能力。针对端到端自动驾驶和闭环*对于场景重建的迫切需求,DriveDreamer4D 利用 DriveDreamer 系列工作的能力,用以生成新轨迹视频(例如变道、加减速),从而大幅提升了多种 4DGS 算法的重建效果。

本篇论文的牵头完成单位为极佳科技,是一家空间智能公司,致力于将视频生成提升到 4D 世界模型,赋予 AI 大模型对于 4D 空间的理解、生成、常识和推理的能力,实现 4D 空间中的交互和行动,走向通用空间智能。通用空间智能对于*游戏、元宇宙等虚拟空间的内容创作,以及自动驾驶、具身智能等物理空间的数据生成和认知推理能力,都有巨大的价值和作用。极佳科技是国内最早开始探索和布局世界模型和空间智能方向的公司,在物理空间和虚拟空间两方面都已取得显著的技术和商业进展,获得了行业广泛的认可。

以上就是世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果的详细内容,更多请关注其它相关文章!


# 还可以  # 潍坊口碑好网站建设价格  # 南通网站推广企业招聘网  # 软文营销推广价位怎么算  # 北流谷歌seo公司  # 网站制作推广哪家优惠大  # 密胺制品公司网站建设  # 医院网站建设的重点  # 辛集通用网站建设哪家强  # 网站如何优化推广  # 泽州谷歌seo公司电话  # 一键  # 成新  # 获得了  # 产业  # 首个  # 闭环  # 所示  # 新突破  # 极佳  # 首次  # follow  # 元宇宙  # ai  # git  # 世界模型  # 极佳科技  # 自动驾驶 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 优化推广96088 】 【 技术知识133117 】 【 IDC资讯59369 】 【 网络运营7196 】 【 IT资讯61894


相关推荐: 在心理治疗中用VR技术,治疗成效显著提高  卫星通信牵引物联网竞争升维,模组厂商如何决胜百亿市场?  马克龙密会AI专家,法国加入全球人工智能竞赛  人工智能产业协同创新中心:全产业链资源在这里汇聚  通用医疗人工智能如何革新医疗行业?  字节、网易相继入局,AI之后大厂又找到下一个风口?  上影节直击 | AI技术降低了短片拍摄门槛?金爵奖评委不赞同  美图秀秀发布七款 AI 工具:修图一样修视频、打造电影级上镜脸  开创全新虚拟现实体验的Pimax Crystal VR头显  无需标注数据,「3D理解」进入多模态预训练时代!ULIP系列全面开源,刷新SOTA  当人工智能开始写高考作文?作家陈崇正、朱山坡谈文学与未来  对艺术家拒绝置若罔闻,Stability AI 将推出适应多种画风的开源模型  ​《流浪地球2》里机器人公司的创始人:未来10年,机器人的崛起!  赋能选题探索:AI助手在经济学专业中的应用指南  小米创始人雷军将揭示小米AI在年度演讲中的最新进展  世界人工智能大会机器人同台炫技!梳理A股相关业务营收占比超50%的个股名单  国宝级文物“铜兽驮跪坐人顶尊铜像”完成模拟拼接,腾讯AI立功  Meta 人工智能业务落后竞争对手,研究人员大量离职成重要原因  1.6亿美元收购Singularity AI,昆仑万维布局通用人工智能  行业首发「超级智绘」AI故事集,TCL实业推进AI技术应用  Meta开源文本生成音乐大模型,我们用《七里香》歌词试了下  面向AI大模型,腾讯云首次完整披露自研星脉高性能计算网络  眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷  GPT-4成功战胜AI-Guardian审核系统:谷歌研究团队的人工智能抵抗人工智能  苹果2万5的AR遭遇砍单95%:不及预期  马斯克反讽人工智能AI炒作:“机器学习”本质就是统计  基于信息论的校准技术,CML让多模态机器学习更可靠  谷歌推出RT-2视觉语言动作模型,使机器人能够掌握垃圾丢弃技能  “思享荟”沙龙热议AIGC与元宇宙 复旦大学赵星畅谈深度数字化  大型无人机FH-98国内首次夜航转场成功  Goodnotes 6推出,带来多项全新AI功能,让电子笔记更智能  商汤科技:元萝卜 AI 下棋机器人新品发布会 6 月 14 日举行  当孔子遇见AI|尼山的“数字”  笔神作文声讨学而思AI大模型 称用“爬虫”技术盗取数据  利亚德加码AI战略,与光年无限图灵机器人全面开展AI研发业务合作  构建数字文旅新高地!洛阳涧西区开启元宇宙时代  上海发布大模型政策 打造AI“模”都  能走、能飞、能游泳,科学家打造全能 M4 机器人  ​布局智能物联新时代,中国移动“5G+物联网”亮相2025 MWC  “黑科技”亮相大湾区轨交论坛 智慧交通迈向“强AI”  农业产业升级:AI驱动的“崃·见田”开启农田未来展望  统信深度deepin成立 AI SIG 社区,共同提升 Linux 下 AI 体验  给小朋友最好的科技礼物:乐天派桌面机器人  映宇宙数字人“映映”亮相ChinaJoy,展示AI黑科技实现用户互动  B站内测 AI 搜索功能,输入“?”即可体验  国网辉南供电:无人机空中巡检 全力护航端午佳节  厂商陆续公布AI进展 完美世界游戏展示复合应用AI in GamePlay  “痴迷”元宇宙,魔珐科技想做什么?  以计算机视觉技术为基础的库存管理如何改革零售行业  微软AR/VR专利提出使用时间复用谐振驱动产生双极性电源 

 2024-10-30

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司


运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。

 8156699

 13765294890

 8156699@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.