OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了

一水 发自 凹非寺

量子位 | 公众号 QbitAI

没错,OpenAI的智能体时代真的要来了!

据大名鼎鼎的“情报员”光头哥爆料,OpenAI在MAC版ChatGPT桌面应用中隐藏了启用/禁用智能体的选项

从截图来看,确实是传闻已久、代号为“Operator(操作员)”的辣个:

今日霍州(www.jrhz.info)©️

而且这则爆料也得到了日常关注苹果方面消息的博主@M1的再次佐证:

Operator正在内测中,即将上线MAC版ChatGPT桌面应用……

今日霍州(www.jrhz.info)©️

根据介绍,Operator能够接管用户PC,直接代替人类自主执行一系列操作(如编码开发应用、订餐,做攻略等等)。

今日霍州(www.jrhz.info)©️

与此同时,OpenAI智能体和其他竞争对手(如Anthropic、谷歌智能体),以及人类选手的跑分对比也曝光了。

先划个重点,在几个评估智能体执行自动化任务水平的基准测试中,OpenAI这边均战胜了Claude智能体。

今日霍州(www.jrhz.info)©️

网友们纷纷激动表示,看起来离发布已经很近了,或许又会是下一个ChatGPT时刻。

今日霍州(www.jrhz.info)©️

而『Windows』用户则开启了刷屏模式,请不要仅限于Mac、请不要仅限于Mac、请不要仅限于Mac……(OpenAI你听到了吗)

今日霍州(www.jrhz.info)©️

多个基准跑分超过Claude智能体

从光头哥的另一条推文里,我们看到了OpenAI智能体和其他竞品的详细对比。

今日霍州(www.jrhz.info)©️

相关数据来自OpenAI网站,具体为图中标黄部分。

今日霍州(www.jrhz.info)©️

单拉出来看,在OSWorld这个专为多模态Agent设置的基准测试中,OpenAI CUA(据推测可能是驱动Operator的AI模型)得分为38.1%,领先于Anthropic的Computer use功能,但还不及人类自己操作的一半水平。

类似情况也在WebArena(CMU发布的基于Web环境的基准测试)上演。

不过,在WebVoyager(由腾讯AI Lab发布的多模态网络Agent基准测试)则稍有反转,OpenAI CUA取得了87%的好成绩,不仅一如既往地领先Anthropic,还以小幅优势超过了人类(85.3%)。

今日霍州(www.jrhz.info)©️

从一些具体任务的完成通过率来看,有辅助的Operator表现好过完全自主操作,不过偶尔还是比不上带视觉能力的GPT-4o。

今日霍州(www.jrhz.info)©️

有网友据此提问Operator是否不如GPT-4o,对此另有热心网友指出了二者区别:

一个是自主操作,一个是教你做事。

另外,对二者安全性的评估如下,GPT-4o在拒绝非法宣传、极端活动讨论等方面均为100%,而Operator在越狱(Jailbreaks)、进行非法活动以及禁止的金融活动方面没有达到100%。

今日霍州(www.jrhz.info)©️

需要提醒的是,在光头哥看来,以上跑分也可能只是占位符,具体真实性无法保证。(先来个免责声明)

今日霍州(www.jrhz.info)©️

2025:OpenAI重点布局Agent

事实上,Operator这款智能体早在去年11月就有相关爆料。

当时彭博社声称,OpenAI将在明年1月推出它,来替用户自动执行任务。

今日霍州(www.jrhz.info)©️

而现在,也算是进一步佐证了之前的消息。

甚至就在去年底,OpenAI CEO奥特曼也在新年目标中,明晃晃地将Agent排在前列。

今日霍州(www.jrhz.info)©️

而Flag立完后,OpenAI刚一开年也是马不停蹄地开始了相关动作。

无论是一次性提醒还是重复执行的动作,告诉ChatGPT你需要什么以及何时需要,它会自动帮你处理。

今日霍州(www.jrhz.info)©️

整体看起来有点偏向日程提醒,更像Agent的初级阶段。

合理推测,Operator将在此基础上有更多、更强的能力表现。

今日霍州(www.jrhz.info)©️

话说,从国内外科技企业对Agent的新追逐来看,今年Agent绝对有好戏看!

据市场研究公司Markets and Markets的分析,AI Agent的市场规模至2030年有望达到471亿美元💵

如此吸引下,再加上已经成熟的大模型技术,Agent火爆2025简直不言而喻。

甚至就在今年的CES上,『英伟达』CEO黄仁勋也对Agent大加赞赏:

未来公司IT部门将成为Agent人力资源部门……(为公司改进大量Agents,从而为各部门提供新支持)

此番言论下,了解AI Agent技术也被开发者们提上了2025学习日程。

今日霍州(www.jrhz.info)©️

好嘛,不管是企业还是个人,接下来大家都得卷Agent了(doge)。

参考链接:

[1]https://techcrunch.com/2025/01/20/openais-agent-tool-may-be-nearing-release/?guccounter=1

[2]https://x.com/minchoi/status/1876644835286777922

量子位智库年终发布三大年度报告

带你一起回顾2024年人工智能智能驾驶Robotaxi新趋势,预见2025年科技行业新机遇

2024年度AI十大趋势报告

Robotaxi2024年度格局报告

智能驾驶2024年度报告

特别声明:[OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

太平年》楚国夫人下线!惨遭轮奸虐杀悬尸上尺度(太平年楚国夫人被羞辱)

可以看出,罗漩对于角色的理解和诠释非常到位,她能够深刻地体会到丁氏的内心世界,也能够将这种情感传递给观众。 反思历史,重温人性虽然《太平年》中的暴力场面引发了一些争议,但不可否认的是,该剧通过楚国夫人的悲剧命…

《<strong>太平年</strong>》楚国夫人下线!惨遭轮奸虐杀悬尸上尺度(太平年楚国夫人被羞辱)

2026水印照片怎么快速去水印,实测榜一键高效处理款(水印图片怎么弄到图片上)

作为常年和素材打交道的博主,我实测了15款去水印小程序,从照片处理速度、去痕效果、画质保留、隐私安全、免费程度5个维度严格打分,终于选出3款「照片去水印王者」——红枣去水印、无损去水印精灵、清痕去水印,帮…

2026水印照片怎么快速去水印,实测榜一键高效处理款(水印图片怎么弄到图片上)

2026款绿林激光测距仪,『设计师』必备的高效量房神器吗?(钬激光 绿激光)

绿林激光测距仪作为一款『设计师』的量房神器,在2026年迎来全新升级。它集高精度、便捷性和创新设计于一体,大幅提高测量效率,帮助『设计师』更精确地完成空间规划。本文将深入解读这款产品的各项优势,并教你如何选择适合自己的工具,避免选购误区。

2026款绿林激光测距仪,『设计师』必备的高效量房神器吗?(钬激光 绿激光)

2026年桌面5S管理必备!鸣固6S四角定位贴能帮你更高效办公吗?(5s办公桌面)

近年来,随着企业对高效管理和规范化运营的追求不断加深,鸣固6S四角定位贴以其独特的T型设计和精准尺寸成为热门选择。这款7.5x3cm的红色定位贴纸(共24个装),不仅能提升办公桌面整洁度,还能助力企业实现5S管理水平升级,让工作环境更井然有

2026年桌面5S管理必备!鸣固6S四角定位贴能帮你更高效办公吗?(5s办公桌面)

销量大增76倍,苹果打起价格战来,国产机真难受(销量暴增)

相比于曾经高高在上的7999元,现在的5499元,相当于降了31%,这也是苹果史上降价最快最狠的手机了,堪称跳水王。 而JD平台显示的数据更直观,直接显示月销量飙升76倍,虽然以前销量也确实不太好,可能基数…

销量大增76倍,苹果打起价格战来,国产机真难受(销量暴增)