CAAI具身智能专委会主任蒋树强:世界模型是智能体进行决策的重要依据(什么是具身智能)

“具身智能体的大脑里应该是什么?”8月2日,“2025第三届人工智能大模型技术高峰论坛”召开,CAAI(中国人工智能学会)具身智能专委会主任、中国科学院大学特聘教授、国家杰青获得者蒋树强围绕智能体的“大脑”构成、大模型在具身智能中的作用、世界模型与记忆等作核心报告。

蒋树强指出,具身智能离不开三个关键词:身体、环境、智能。它们之间存在深层次、复杂的关系,智能的实现依赖于身体的结构、感知能力与环境的交互。

“具身智能可以理解为在身体上融入智能,本体和智能同样重要。智能不仅存在于大脑,还与感知、认知、行为密切相关。”蒋树强表示,身体的结构、形态、感知器与行为能力共同构成智能的一部分,对智能的实现具有重要影响。例如,身高、肢体结构、感官分布等决定了智能体如何感知和理解世界。

关于具身大模型,蒋树强认为,具身大模型一般需融合视觉、语言和行为数据进行训练。训练具身大模型需要数据、算力、算法三者统一。数据不再只是文本或视频,而是包含行为、物理参数、触觉等多模态信息,复杂度更高。

“我觉得在特定场景下,只用一种类型的本体去训练,相对务实一点。但如果是各种各样的机器形态一起训练,事情的复杂度会很高。”因此,蒋树强表示,具身大模型在真实物理空间中的泛化能力、数据复杂度、传感器差异等问题仍是挑战。

蒋树强还提到,世界模型是对真实世界的抽象表示,包括三维空间、动态变化、对象关系、记忆与知识等。其目标是对环境状态进行理解和预测,是智能体进行决策的重要依据。NIPS 2018的一篇文章指出,世界模型相当于是推理和角色相关模型系统。然而世界模型和大模型的关系以及世界模型和三维空间的关系,都是值得去思考和挖掘的。

“我们现在有单臂的『机器人』️,让它去自动导航到一个地方,把桌面收拾干净。实际上,这个是偏工程实现的,没有太多理论的方法,我们主要做研究还是在导航这一块。”蒋树强介绍,目前研究中大量使用模拟器生成数据,但虚拟环境的物理参数可能不够真实,如何将虚拟与真实环境对齐仍是难题。

特别声明:[CAAI具身智能专委会主任蒋树强:世界模型是智能体进行决策的重要依据(什么是具身智能)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

57岁『伊能静』和『秦昊』一家度假,晒泳装照秀身材(『伊能静』对象『秦昊』)

她自创的美妆品牌静享,年销售额已经突破了两亿元,而且还和瑞士实验室进行深度合作,这可不是简单的玩票,而是她在商业领域深耕的成果。 说到底,『伊能静』给同龄人最大的启示,或许并非她的年轻、富有,而是她展现了一种…

57岁『伊能静』和『秦昊』一家度假,晒泳装照秀身材(『伊能静』对象『秦昊』)

真我回归OPPO后的王炸!2039元Neo8把红米K90按在地上摩擦(真我回归OPPO后,与一加三个品牌的定位分别是什么)

毕竟2000元档位选机,核心就是“同价选更优”,真我Neo8到底强在哪,咱们一步步拆解,看完你就知道它为啥能碾压K90了。真我Neo8内置8000mAh硅碳负极电池,我轻度使用能做到三天两充,连续玩7.7小时…

真我回归OPPO后的王炸!2039元Neo8把红米K90按在地上摩擦(真我回归OPPO后,与一加三个品牌的定位分别是什么)

吴优重新定义靓姐风格,身穿蓝白变色连衣裙👗分外清纯秀丽!(吴优dj)

软乎乎的像丝绸,但又不会贴在身上显胖,走路时裙摆轻轻摆动,像海浪拍在沙滩上的弧度,连带着吴优的步伐都变得轻盈起来 —— 这哪里是穿裙子👗,明明是把“清纯” 两个字织在了身上!她的眼神里还是有那种飒爽的劲儿,但…

吴优重新定义靓姐风格,身穿蓝白变色连衣裙👗分外清纯秀丽!(吴优dj)

封面点击率翻番!玫瑰克隆「爆款封面」,一键复刻高流量封面(封面点击率翻番怎么算)

做小红书的你,是不是总在封面这一步卡壳? 点击「克隆爆款封面」,系统会生成4张风格统一的封面图,比如克隆汽车类爆款封面,会生成不同角度的写实效果图,色彩和质感完全还原原作,直接下载就能用在笔记里,大幅提升点击…

封面点击率翻番!玫瑰克隆「爆款封面」,一键复刻高流量封面(封面点击率翻番怎么算)

2026年办宴席酒席帐篷停车棚遮阳棚哪家靠谱?适合农村流动婚礼摆摊吗?(2025年办酒席规定)

随着户外活动增加,越来越多乡村宴席选择临时篷房。本篇详细解答如何选好宴席帐篷、遮阳棚和停车棚,兼顾美观实用和性价比,确保场地布置得体大方。

2026年办宴席酒席帐篷停车棚遮阳棚哪家靠谱?适合农村流动婚礼摆摊吗?(2025年办酒席规定)