谷歌“世界模拟器”深夜上线!一句话生成3D世界,支持分钟级超长记忆

克雷西 发自 凹非寺

量子位 | 公众号 QbitAI

只需一句话,就能生成可实时交互的3D世界。

刚刚,谷歌DeepMind发布了新一代通用世界模型Genie 3。

性能上,Genie 3相比上一代大幅升级,支持720P画质,每秒24帧实时导航,以及分钟级的一致性保持。

前DeepMind科学家、AI 3D生成创业者Tejas Kulkarni受邀体验了Genie 3。

他使用Genie 3,生成了长达57秒的城市高空漫游场景(下图为节选):

Tejas评价,Genie通用性强,还能学习物理,而且拥有强大的记忆力。

看了Tejas的测试,Reddit网友直言,这是通往AGI的最后一块拼图。

目前,Genie 3已经以研究预览的形式发布,邀请专业研究者和创作者进行测试。

长时间多角度物体依然一致

相比前一代Genie 2,Genie 3在画质、交互方式和时长,以及实时性方面均大幅提升。

Genie 3的生成结果具备3D空间一致性,并且由于是根据世界描述和用户操作逐帧创建的,Genie 3生成的世界更加丰富且更具动态。

而且Genie 3能够模拟世界的物理特性,处理水面等自然现象和复杂的环境相互作用。

也可以模拟自然世界,创造充满活力的生态系统。

当然也不局限于现实场景,Genie 3也可以发挥想象力,构建动画等虚拟场景。

比如让毛茸茸的小精灵在童话世界中玩耍奔跑。

或者跟着萤火虫的轨迹,探秘一片带有魔法色彩的原始森林。

还能超越地理和时间的界限,探索更多地方和更古老的时代,乘船漫游威尼斯的水上世界。

当然最让谷歌引以为傲的,还要属Genie 3的长期环境一致性。

为了使AI生成的世界具有沉浸感,画面中的物体必须在很长一段时间内保持物理一致性。

但自回归生成环境通常比生成完整视频更难,因为误差往往会随着时间的推移而累积。

不过Genie 3的环境在几分钟内仍能保持基本一致,视觉记忆甚至可以追溯到一分钟前,谷歌专门展示了相关结果。

比如这是一组在雅典风格建筑中漫步的场景,先来看下完整视频:

谷歌特别展示了视频开始以及第20、50秒的截图,画面中建筑物左侧的树木反复进入和退出视野后始终保持一致。

还有这个刷油漆的场景,视角虽然不断变换,但每一步的涂刷操作和结果都被Genie 3准确记住。

此外,Genie 3还支持基于文本提示在世界当中生成事件。

比如给定一个草原的背景,可以让拖拉机从中开过,还可以把拖拉机换成一只棕熊。

又如在伦敦的河畔,可以让快艇从水面驶过,也可以让穿着奇装异服的人在岸上奔跑,还能让一只恐龙从天而降。

推动具身智能体研究

DeepMind介绍,Genie 3也将进一步推动具身智能体研究。

实际上,DeepMind十多年来一直在关注模拟环境领域的研究,从训练智能体掌握实时战略游戏, 到开发用于开放式学习和『机器人』️技术的模拟环境。

去年,DeepMind推出了Genie 1和Genie 2这两个基础世界模型,它们同样可以为智能体生成新的环境。

这次的Genie 3,则是DeepMind第一个允许实时交互的世界模型。

为了测试Genie 3创建的世界与未来智能体训练的兼容性,DeepMind为SIMA智能体(用于3D虚拟场景的通用智能体)的最新版本生成了世界。

Genie 3并不知道智能体的目标,而是根据其操作来模拟未来事件。

比如在面包店中,走向搅拌机、冷却架或者玻璃柜。

或者在农贸市场中走向面包摊、花摊和蔬菜摊位。

总之,Genie 3相比过去可以执行更长的操作序列,从而实现更复杂的目标。

谷歌期待这项技术在人类迈向AGI的过程中发挥关键作用,并使智能体进一步走进现实世界。

参考链接:

[1]https://deepmind.google/discover/blog/genie-3-a-new-frontier-for-world-models/

[2]https://x.com/tejasdkulkarni/status/1952737669894574264

特别声明:[谷歌“世界模拟器”深夜上线!一句话生成3D世界,支持分钟级超长记忆] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

『蔡卓妍』小10岁私教男友收入曝光,时薪2000月入10万,每日课时爆满(『蔡卓妍』20岁)

分手后曾有传言称两人已经低调复合,但这些都仅仅是外界的猜测,『蔡卓妍』后来亲自否认了这一说法。两人之间的关系顺其自然地发展,之前甚至有港媒报道称,林俊贤已经住进了『蔡卓妍』价值过亿的豪宅,显然两人的感情已经发展得相当…

『蔡卓妍』小10岁私教男友收入曝光,时薪2000月入10万,每日课时爆满(『蔡卓妍』20岁)

【2026.1.23】焦恩俊在干嘛?胡连馨是什么样的人?闫桉这个人怎么样?张睿和李若嘉?(焦恩俊个人资料简介老婆)

在湾湾生活,每天基本就是种种菜逛逛街养养鸟什么的,已经过好几年退休生活了,对复出拍戏兴趣不大,偶尔愿意在网上分享一下自己的动态,帮女儿做点宣传什么的;3 想请爆姐讲一下胡连馨女生是个什么样的人,很想了解她…

【2026.1.23】焦恩俊在干嘛?胡连馨是什么样的人?闫桉这个人怎么样?张睿和李若嘉?(焦恩俊个人资料简介老婆)

DTC品牌出海的流量突围:抢占ChatGPT与Perplexity推荐的高地(中国dtc出海)

智子边界(OmniEdge)作为企业的“AI增长合伙人”,凭借其深厚的算法基因和国际化视野,为DTC出海品牌提供了一套极具杀伤力的解决方案。创始人黄俊耀先生拥有中国精算师与腾讯AI算法『工程师』背景,这种“精算…

DTC品牌出海的流量突围:抢占ChatGPT与Perplexity推荐的高地(中国dtc出海)

历史剧《太平年》中讲述的一次和平统一 钱氏家族为何选择“纳土归宋”(历史剧《太平年》今晚首播时间)

五代十国时期,是中国历史上一个极为特殊的大分裂时期。在半个多世纪里,中原大地王朝更迭如走马灯,周边则环绕着十余个大小割据政权。这个武夫当国、兵连祸结的时代,也是区域经济文化艰难发展、最终孕育统一契机的过渡期。央视一套开播的开年历史大剧《太平

历史剧《<strong>太平年</strong>》中讲述的一次和平统一 钱氏家族为何选择“纳土归宋”(历史剧《<strong>太平年</strong>》今晚首播时间)

杨鸣辞任辽篮主帅 因身体原因请辞(辽篮杨鸣老丈人是干嘛的)

辽宁沈阳三生飞豹篮球俱乐部主教练杨鸣因个人身体原因,正式向俱乐部提出辞去主教练职务的申请。杨鸣表示未来将继续为辽宁篮球贡献力量。经过充分沟通,俱乐部尊重其个人意愿,并同意他离队休整

杨鸣辞任辽篮主帅 因身体原因请辞(辽篮杨鸣老丈人是干嘛的)