谷歌Gemini『机器人』️新突破:离线AI让『机器人』️更灵活应对新挑战

近期,谷歌在人工智能领域的一项新进展引起了广泛关注。在一则最新播客节目中,一款搭载了Gemini人工智能技术的『机器人』️,在没有事先教导的情况下,成功完成了一次“扣篮”动作,展现了其迅速适应新环境的能力。

这一壮举紧随其在洛杉矶RSS2025(『机器人』️软件与系统大会)上的全球首次互动式现场展示。会上,运行着Gemini Robotics On-Device模型的『机器人』️吸引了众多目光。硅谷AI领域的观察者Ted Xiao对此评论道:“这仿佛是对未来的一次神奇预览——只需与『机器人』️进行对话,它就能做出恰当的回应,并尝试执行一系列合理的操作,无论是面对新的物体、命令还是技能。”

今日霍州(www.jrhz.info)©️

Gemini Robotics On-Device模型于6月24日正式发布,这一创新将AI引入了『机器人』️领域,且整个过程中无需持续依赖『互联网』连接,实现了离线工作。谷歌在X部门强调,这是他们首个“视觉-语言-动作”模型,旨在帮助『机器人』️更快、更高效地适应各种新任务和新环境。

回顾今年早些时候,Figure公司发布的“历史上最重大的人工智能更新”——Helix,同样是一款专注于通用人形『机器人』️控制的“视觉-语言-动作”(VLA)模型。然而,与Figure的模型不同,谷歌的这款模型能够独立于数据网络运行,这对于对延迟敏感的应用尤为关键,确保了即使在间歇性或无网络连接的环境中也能稳定运行。

事实上,早在今年3月,谷歌就已推出了第一代VLA(视觉语言动作)模型Gemini Robotics,将Gemini 2.0的多模态推理和现实世界理解能力引入物理世界。而此次发布的Gemini Robotics On-Device模型,作为双臂『机器人』️的基础模型,除了极大地减少了计算资源需求外,还主要解决了三个核心问题:灵巧操作、新任务的快速适应以及基于本地运行的低延迟推理。

今日霍州(www.jrhz.info)©️

在官方演示视频中,一对灵巧的机械手不仅能够轻松拿起一支笔,还能相互配合拔掉笔盖。随后的测试中,这对机械手成功完成了“放置蓝色砖块”、“拉开中间抽屉”以及“归位‘梨’模型”等任务,仅凭自然语言指令如“Can you close the middle drawer?”(你能关上中间的抽屉吗?)就展现出了强大的视觉、语义和行为泛化能力。

除了演示之外,Gemini Robotics On-Device模型在基础跑分数据上也表现出色。在泛化能力方面,尽管略低于谷歌旗舰Gemini Robotics模型的表现,但仍远超之前最好的离线模型。在分布式任务和复杂多步骤指令方面,该模型也优于其他设备端替代方案。

面对家中无数形状、大小、颜色和纹理各异的物品,『机器人』️需要能够按需产生智能的新行为,尤其是对于那些从未见过的物体。『机器人』️技术的一大挑战在于,举一反三并非易事。而Gemini Robotics On-Device模型通过50到100次演示即可快速适应新任务,展现了其强大的新任务适应能力。

谷歌还展示了这一性能在实际应用中的效果,将其调整并应用到了双臂Franka FR3『机器人』️和Apptronik的Apollo人形『机器人』️上。在Franka『机器人』️上,该模型能够执行通用指令,处理以前未见过的物体和场景,完成包括折叠衣服在内的灵巧任务,以及需要精确度和灵巧性的工业皮带组装任务。在Apollo人形『机器人』️上,通用模型同样能够遵循自然语言指令,以通用的方式操控不同的物体,包括之前从未见过的物体。

这一系列创新引发了网友的热烈讨论。有人认为,谷歌的脱机AI『机器人』️具有改变游戏规则的可能性。然而,也有人提出质疑,询问这与特斯拉『机器人』️的设计有何不同,以及与ylecun在meta所做的工作有何差异。在『机器人』️/具身智能这一赛道上,各家大模型正展现出多样性和丰富性的技术向度,共同指向同一个核心命题——如何让AI在三维物理世界中建立真正的因果认知。

特别声明:[谷歌Gemini『机器人』️新突破:离线AI让『机器人』️更灵活应对新挑战] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

“最美亚姐”杨恭如否认整容,曾被富豪原配当众掌掴,如今怎样了

最近,昔日的“亚洲小姐”冠军杨恭如,就以一场干脆利落的“在线辟谣”,再次闯入公众视野,让无数网友感叹:这位姐姐,活得是越来越通透了! 历经浮沉,如今的杨恭如,似乎找到了与世界、与自己和平相处的方式。所幸,在剧…

“最美亚姐”杨恭如否认整容,曾被富豪原配当众掌掴,如今怎样了

2025年如何挑选短视频总结工具?5款优质工具深度对比(2025如何挑选质量好的电压力锅呢)

Notion AI:笔记工具附带的视频总结功能,需要手动调整格式。30分钟会议视频,听脑AI 97%,Notion AI 82%,漏了3个关键决策点。MetaMind也处理了同一个视频,准确率90%,但用了2…

2025年如何挑选短视频总结工具?5款优质工具深度对比(2025如何挑选质量好的电压力锅呢)

热玛吉四代和五代的区别(热玛吉四代和五代哪个更安全)

热玛吉四代与五代在治疗体验上有细微差别,主要体现在治疗时间、精准度以及过程中的舒适感受。两者均能有效紧致肌肤、减轻色斑并缓解面部皱纹,但五代是四代的升级版,治疗效率更高——在相同皮肤问题处理上,四代需1200发完成,而五代仅需900发即可

热玛吉四代和五代的区别(热玛吉四代和五代哪个更安全)

ehs软件安全管理模式(ehs管理程序)

系统还可以帮助将法规的具体要求分解为可执行的任务或检查项,融入到日常的检查表和操作程序中,确保管理活动与法规要求保持一致。 2、它强调基于数据的决策支持,通过对管理过程中产生的大量信息进行分析,揭示潜在趋势,…

ehs软件安全管理模式(ehs管理程序)

2025年女用按摩器K2智能按摩新体验?(女性♀️按摩器品牌排行)

随着健康意识提升,女用按摩器成为现代女性♀️护理新宠。本文详解K2按摩器智能设计亮点、舒适体验及选购注意事项,助您轻松享受专业按摩护理。 K2以其创新的人体工学设计和智能调节功能引领潮流,是值得尝试的高品质按摩伴侣。

2025年女用按摩器K2智能按摩新体验?(女性♀️按摩器品牌排行)