南大等8家单位,38页、400+参考文献,物理模拟器与世界模型驱动的『机器人』️具身智能综述

今日霍州(www.jrhz.info)©️

本文作者来自:南京大学、香港大学、中南大学、地平线、中国科学院计算所、上海交通大学、慕尼黑工业大学、清华大学。

当下,随着『机器人』️与人工智能技术的飞速进展,“具身智能”(Embodied Intelligence)已成为业界与学界共同关注的核心课题。与纯感知或生成任务不同,具身智能要求智能体在复杂环境中自主感知、预测并执行动作,才能真正迈向通用智能(AGI)。而要实现这一宏大目标,物理模拟器与世界模型的深度融合被认为是最具潜力的路径:前者通过高度可控的虚拟环境,为算法训练提供安全、高效的多场景试错土壤;后者则模拟了从感知到决策的 “脑内演算” 过程,使智能体能够在动作之前,先在内部进行环境预测与策略规划。

这篇由南京大学、香港大学等机构学者撰写的综述论文 —— A Survey: Learning Embodied Intelligence from Physical Simulators and World Models,使用 25 张图、6 张表格、超 400 篇参考系统地梳理了两大技术如何协同推动『机器人』️从 “会做” 向 “会想” 演进的全貌。

今日霍州(www.jrhz.info)©️

  • 论文题目:A Survey: Learning Embodied Intelligence from Physical Simulators and World Models
  • 工作内容:基于物理模拟器与世界模型的具身智能学习
  • 论文链接:https://arxiv.org/abs/2507.00917
  • 仓库链接:https://github.com/NJU3DV-LoongGroup/Embodied-World-Models-Survey

论文摘要

jrhz.info

对通用人工智能(AGI)的追求使具身智能成为『机器人』️研究的前沿课题。具身智能关注的是能够在物理世界中感知、推理并行动的智能体。要实现鲁棒的具身智能,不仅需要先进的感知与控制能力,还需具备将抽象认知扎根于现实交互中的能力。

在这一过程中,两项基础技术 —— 物理模拟器与世界模型 —— 已成为关键推动力量。物理模拟器为训练与评估『机器人』️智能体提供了可控、高保真度的环境,使复杂行为的开发变得安全而高效。相比之下,世界模型为『机器人』️赋予了对环境的内部表示能力,从而使其能够进行预测性规划和超越直接感知的自适应决策。

本文系统回顾了近年来通过物理模拟器与世界模型融合学习具身智能的研究进展。我们分析了这两者在提升智能体自主性、适应性与泛化能力方面的互补作用,并探讨了外部模拟与内部建模之间的协同关系,如何推动从模拟训练走向真实部署的跨越。通过整合当前的研究成果与开放问题,本文旨在为构建更强大、更具泛化能力的具身智能系统提供全面的视角。我们还维护了一个持续更新的文献与开源项目仓库,地址为:https://github.com/NJU3DV-LoongGroup/Embodied-World-Models-Survey。

主要贡献:

  • 智能『机器人』️能力分级标准: 提出一个涵盖自主性、任务处理能力、环境适应能力与社会认知能力四个关键维度的五级能力分级体系(IR-L0 至 IR-L4)。
  • 『机器人』️学习技术分析: 系统回顾智能『机器人』️在腿式运动(如双足行走、摔倒恢复)、操作控制(如灵巧操作、双手协调)与人机交互(如认知协作、社会嵌入)方面的最新技术进展。
  • 主流物理模拟器分析: 全面对比 Webots、Gazebo、MuJoCo、Isaac Gym/Sim/Lab 等主流模拟器的物理仿真能力、渲染质量与传感器支持能力。
  • 世界模型的最新进展: 首先回顾世界模型的代表性架构及其潜在作用,例如作为可控模拟器、动态建模器与奖励模型在具身智能中的应用。进一步探讨专为自动驾驶与关节型『机器人』️设计的最新世界模型方案。

研究内容与结构一览

今日霍州(www.jrhz.info)©️

1、智能『机器人』️五级能力分级(IR-L0 ~ IR-L4)

  • IR-L0:基础执行 —— 完全依赖人类指令,无环境感知。
  • IR-L1:规则响应 —— 有限的传感器驱动,能在封闭环境下执行预设任务。
  • IR-L2:感知自适应 —— 引入视觉、LiDAR 等多模态,具备基本路径规划与避障能力。
  • IR-L3:类人协作 —— 多轮对话、情感识别,能在动态场景中与人类协同工作。
  • IR-L4:完全自主 —— 具备自我生成目标、长期学习与伦理决策能力 。

2、『机器人』️核心技术回顾

  • 运动能力:从 Model Predictive Control、Whole-Body Control,到基于深度强化学习的端到端策略;
  • 操控能力:单臂抓取到双臂协作,乃至全身动作控制,辅以 VLM/LLM 驱动的视觉 — 语言 — 动作一体化模型;
  • 交互能力:认知协作、物理安全与社会嵌入三大维度的最新进展 。

3、物理模拟器横评

回顾主流模拟平台(Webots、Gazebo、MuJoCo、Isaac Gym/Sim)的物理引擎精度、渲染质量及传感器组件支持;

对比其在异构硬件与大规模并行训练中的表现差异,并指出未来优化方向。

4、世界模型架构与应用

代表性结构:从预测网络、生成式模型到多任务复合型 “动态+奖励” 模型;

应用场景:自动驾驶中的轨迹预测、关节『机器人』️中的仿真 — 现实闭环校准。

智能『机器人』️分级标准

今日霍州(www.jrhz.info)©️

仿真器仿真能力对比

今日霍州(www.jrhz.info)©️

仿真器渲染能力对比

今日霍州(www.jrhz.info)©️

自动驾驶领域的世界模型代表性工作汇总

今日霍州(www.jrhz.info)©️

『机器人』️领域的世界模型代表性工作汇总

今日霍州(www.jrhz.info)©️

特别声明:[南大等8家单位,38页、400+参考文献,物理模拟器与世界模型驱动的『机器人』️具身智能综述] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

收缩毛孔什么产品效果好?紧致肌肤收缩毛孔产品推荐(收缩毛孔的是什么)

是目前收缩毛孔效果最好的产品,天然蜗牛原液被称为护肤黄金液,收缩毛孔『美白』『补水』,修复受损肌肤紧致肌肤效果特别好,市面上99%的蜗牛原液都是合成的,这家是真正天然的,黄河故道是全球主要的蜗牛原液原产地,天然的温…

收缩毛孔什么产品效果好?紧致肌肤收缩毛孔产品推荐(收缩毛孔的是什么)

华为手机全系降价 最高达4000元 多款机型参与优惠(华为降版本多少钱)

华为官方宣布,从即日起至2月28日,Pura 80系列指定机型最高优惠1500元,Mate 70系列指定机型最高优惠1800元,Mate X6系列最高优惠2000元

华为手机全系降价 最高达4000元 多款机型参与优惠(华为降版本多少钱)

【2026.1.31】翟博士和『孟子义』?单依纯现在单身?《雪迷宫》第二部?『李宏毅』私底下咋样?《风过留痕》? 多说说王真儿呗?(翟波近况如何)

筹备过几次,但都不成功,片方是挺想做第二季的,碍于现实大概率做不成,有那个时间成本,都能开两个新IP了,这也是很多剧续集做不起来的主要原因 这种类型的女艺人都是这样,有固定的资源在捧,所以不太需要跟别人竞争…

【2026.1.31】翟博士和『孟子义』?单依纯现在单身?《<strong>雪迷宫</strong>》第二部?『李宏毅』私底下咋样?《<strong>风过留痕</strong>》? 多说说王真儿呗?(翟波近况如何)

47岁『高圆圆』自驾游海南,穿无袖黑背心露大粗臂,捡松果碰见羊粪蛋(『高圆圆』24岁)

2026年1月30日,47岁的『高圆圆』在小红书更新了一条海南自驾游vlog,瞬间刷爆网络,镜头里的她褪去精致,在吊罗山国家森林公园里活得肆意又鲜活。大家都被这样的『高圆圆』圈粉,比起红毯上完美的女神,他们更爱这个在…

47岁『高圆圆』自驾游海南,穿无袖黑背心露大粗臂,捡松果碰见羊粪蛋(『高圆圆』24岁)

独居长辈的 “隐形陪伴者”!众心邦 AI 守护表,一键呼救 + 静默监测,守护不打烊

它不堆砌冗余功能,只聚焦健康监测、一键呼救、精准定位等核心需求,用简洁的设计、便捷的操作,让独居长辈愿意用、用得顺,让守护无需刻意迁就。众心邦AI 守护表以静默监测守护健康、以一键呼救应对紧急、以贴心设计适…

独居长辈的 “隐形陪伴者”!众心邦 AI 守护表,一键呼救 + 静默监测,守护不打烊