谷歌发布Gemini 2.5 Computer Use模型:专攻浏览器交互(谷歌发布Gemini 2.0)

10 月 8 日消息,谷歌正在预览一款全新的 Gemini 人工智能模型,该模型旨在通过浏览器浏览网络并与之交互,使 AI 智能体能够在原本为人而非『机器人』️设计的用户界面中执行操作。这款名为“Gemini 2.5 计算机使用”(Gemini 2.5 Computer Use)的模型,利用“视觉理解与推理能力”分析用户的请求,并完成相应任务,例如填写并提交表单。

该模型可用于用户界面测试,或用于操作那些仅面向人类用户、未提供 API 或其他直接接口的系统。此前,此类模型已应用于谷歌 AI 模式(AI Mode)中的智能体功能,以及研究原型项目“Mariner”,该项目利用 AI 智能体在浏览器中自主执行任务,例如根据食材清单自动将商品添加到购物车🛒。

谷歌此次发布恰逢 OpenAI 在其年度开发者日(Dev Day)宣布推出 ChatGPT 新应用的次日。OpenAI 正持续聚焦其“ChatGPT 智能体”(ChatGPT Agent)功能,该功能可代表用户完成复杂任务。与此同时,Anthropic 公司已于去年发布了其 Claude AI 模型的“计算机使用”(computer use)版本。

注意到,谷歌发布了一些演示视频,展示了“计算机使用”工具的实际运行效果,并注明视频播放速度已加快至 3 倍。谷歌表示,其计算机使用模型“在多个网页和移动端基准测试中优于现有领先方案”。与 ChatGPT 智能体和 Anthropic 的计算机使用工具不同,谷歌的新 AI 模型仅限于访问浏览器环境,无法操控整个计算机系统。谷歌特别指出,该模型“尚未针对桌面操作系统层级的控制进行优化”,目前支持 13 种操作,包括打开网页浏览器、输入文本,以及拖放页面元素等。

Gemini 2.5 计算机使用模型现已通过 Google AI Studio 和 Vertex AI 向开发者开放。此外,Browserbase 平台也提供了在线演示,用户可实时观看该模型完成诸如“玩一局 2048 游戏”或“浏览 Hacker News 上的热门讨论”等任务。

特别声明:[谷歌发布Gemini 2.5 Computer Use模型:专攻浏览器交互(谷歌发布Gemini 2.0)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

辛芷蕾新作《女神蒙上眼》首播获赞,“罗生门”式单元案件引全网追更(辛芷蕾短片)

女神蒙上眼》采用单元故事结构,通过十余个法律案件串联起职场博弈、情感纠葛与社会思辨,展现法律条文在现实生活中的应用案例,也通过委托人的命运抉择折射出当代社会的多元议题,以“法理与人性”的碰撞为核心,为观众…

辛芷蕾新作《<strong>女神蒙上眼</strong>》首播获赞,“罗生门”式单元案件引全网追更(辛芷蕾短片)

外甥写成外孙遗嘱仍有效 笔误无碍真意(外甥有遗产继承权吗)

上海男子张先生去世后,亲属在其遗物中发现一份手写遗嘱,明确遗产由“大外孙李烔”继承。然而,张先生未婚未育,没有外孙,且继承人的名字也写错了——“炯”成了“烔”。这份充满漏洞的遗嘱一度让张先生的两个姐姐对簿公堂

外甥写成外孙遗嘱仍有效 笔误无碍真意(外甥有遗产继承权吗)

2026马年国潮风手写春联如何挑选?教你选对有创意的新款对联

2026年新春临近,国潮风五字对联成为新年氛围的创意点缀。本文详解如何挑选合适的书法春联,涵盖尺寸、字体、工艺、风格等多个实用选购要素,助您打造有温度的新年氛围。

2026马年国潮风手写春联如何挑选?教你选对有创意的新款对联

杭州春节红包🧧是否需要退还?2026年的规矩全解析!(杭州春节红包🧧政策)

春节期间收到的红包🧧是否要退?本文深入解读杭州地区的春节红包🧧返还习俗与规则,分析退还是保留的不同影响因素,帮助你做出最佳选择。从文化传统到法律依据,为你揭示2026年最新的春节红包🧧处理方式。

杭州春节红包🧧是否需要退还?2026年的规矩全解析!(杭州春节红包🧧政策)

现在的真实情况是:中国的DDR5『芯片』,也救不了内存市场了(真实的情感)

当时大家说,最后还得靠中国的DDR5『芯片』,来救内存市场,因为只有中国厂商才有这能力,将高科技产品,打成白菜价,利用中国制造的优势,卷翻行业。 在这样的情况之下,中国的DDR5『芯片』,是救不了内存市场的,中国的…

现在的真实情况是:中国的DDR5『芯片』,也救不了内存市场了(真实的情感)