2025年Perplexity Comet电商购物能力测试报告

今天分享的是:2025年Perplexity Comet电商购物能力测试报告

报告共计:51页

AI购物助手大比拼:谁能真正帮你"买遍全网"?

随着人工智能技术的快速发展,AI购物助手正逐渐走进人们的日常生活。从挑选商品到加入购物车🛒,甚至完成支付,这些智能工具试图简化整个购物流程。近日,一份针对四款主流AI购物助手(OAI Agent、Perp Comet、Manus、Genspark)的实测报告引发关注,通过五大真实购物场景的考验,这些AI工具的实际能力高下立判。

一场跨越五大场景的实战考验

为了全面评估AI购物助手的真实水平,测试团队设计了五大贴近生活的购物任务:亚马逊商品复购、查找最快发货的自行车、采购聚会用造景杂物、按预算挑选『风衣』、选购符合特定条件的冰箱。这些任务不仅考验AI的搜索和筛选能力,更涉及到与电商平台的交互、购物车🛒操作甚至支付准备等实际操作。

从整体表现来看,Perp Comet和Genspark表现最为亮眼,在五项任务中均取得成功;OAI Agent和Manus则各有一项任务失败。在效率上,Perp Comet以平均318秒的完成时间遥遥领先,而OAI Agent平均耗时高达1193秒,差距明显。

值得注意的是,不同场景对AI的能力要求各有侧重。比如亚马逊复购任务需要AI访问历史订单并完成再次购买,考验的是跨平台数据调取和操作连贯性;而聚会杂物采购则需要AI主动推理模糊需求——"造景杂物"具体包含什么、适合多大规模的聚会,这背后是对用户潜在需求的理解能力。

从"看懂需求"到"完成支付":AI能力的十级阶梯

测试团队将电商购物能力划分为十级梯度,从最基础的"理解购物需求"到最高阶的"执行支付操作",全面勾勒出AI购物助手的能力边界。

在基础能力层面,四款AI工具表现旗鼓相当,都能准确解析用户需求、在目标平台执行搜索并返回结果。比如在挑选『风衣』的任务中,所有工具都能精准把握"米色、500美元💵以内、带腰带和双排扣"等核心条件,筛选出符合要求的商品。

但在高阶能力上,差距开始显现。第八级"购物车🛒操作"(添加、修改、删除商品)中,Manus未能达标,只能提供购物清单而无法实际操作;第九级"订单预处理"(填写地址、选择配送方式)中,四款工具里只有Manus掉队;到了最高级的"支付完成"环节,目前仅有Perp Comet展现出完成潜力——虽然测试中因需绑定支付信息未实际完成,但它能引导用户完成前期准备,提示绑定账户后即可执行支付,其他工具则均未达到这一水平。

这种能力差异在实际场景中体现得尤为明显。比如采购聚会杂物时,Perp Comet和Genspark不仅能列出清单,还能自动将商品加入购物车🛒,其中Genspark挑选的物品多达9种,远超OAI Agent的5种;而Manus则只能提供方案,需要用户手动购买。

各有千秋:四款AI工具的实战画像

Perp Comet无疑是本次测试中的"速度之王"。在查找最快发货自行车的任务中,它仅用20秒就完成了五款产品的发货时间对比,且信息全部来自品牌官网,准确性极高。其优势在于高效的平台交互能力,无论是亚马逊复购还是聚会杂物采购,都能快速完成从筛选到加购的全流程,甚至在支付环节展现出独特优势。

Genspark则以"细致全面"见长。在挑选『风衣』时,它不仅列出价格、评分等基础信息,还详细标注了材质、防水性能等用户关心的细节;采购聚会杂物时,它能根据追问自动打开亚马逊网站并添加商品,种类丰富且操作流畅。不过,它在工具调用上不够自动化,需要用户明确指令才能进行下一步操作。

OAI Agent的表现略显不稳定。虽然在聚会杂物采购中成功将商品加入购物车🛒,但在亚马逊复购任务中因跨域限制无法访问网站,且整体耗时较长。其优势在于对多平台的适配能力,能在Target等网站完成操作,但稳定性有待提升。

Manus则更像"方案提供者"而非"操作者"。在各项任务中,它能制定详细的购物清单和对比表格,甚至会询问用户聚会规模等细节以优化方案,但始终无法完成添加购物车🛒等实际操作,在高阶能力上存在明显短板。

购物场景:AI能力的"试金石"

为何选择电商购物作为AI能力的测试场景?测试团队认为,购物看似简单,实则是对AI综合能力的全面考验。它不仅需要理解用户的个性化需求(如预算、喜好),还要处理复杂的执行流程(如跨平台交互、信息验证),更需要建立用户信任——毕竟涉及支付等敏感操作。

从测试结果来看,AI购物助手已经在基础购物环节展现出实用价值。比如帮用户筛选符合条件的冰箱、对比不同自行车的发货时间,这些都能显著节省时间。但在高阶操作上,尤其是支付环节,技术之外的用户信任问题可能更为关键——即使AI具备支付能力,用户是否愿意让其处理支付信息,仍是需要突破的心智障碍。

随着技术的不断迭代,AI购物助手或许将成为未来生活的标配。无论是忙碌的上班族想快速采购生活用品,还是新手父母需要为孩子挑选合适的商品,这些智能工具都有望提供更高效、更贴心的服务。而这场测试也让我们看到,在"读懂需求"到"完成购买"的道路上,AI正在一步步靠近人类的期待。

以下为报告节选内容

报告共计: 51页

中小未来圈,你需要的资料,我这里都有!

特别声明:[2025年Perplexity Comet电商购物能力测试报告] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

星纪魅族申请基于车辆状态控制壁纸显示专利,提升用户的感知价值与交互体验

国家知识产权局信息显示,武汉星纪魅族科技有限公司申请一项名为“基于车辆状态控制壁纸显示方法、装置、设备及介质”的专利,公开号CN121387409A,申请日期为2025年9月。 专利摘要显示,本公开涉及一种基…

星纪魅族申请基于车辆状态控制壁纸显示专利,提升用户的感知价值与交互体验

卡罗娜瓷砖真·STONE系列-卡地亚:让奢感变得触手可及(卡罗纳瓷砖生产厂家)

设计灵感 DESIGN INSPIRATION 卡罗娜瓷砖真·STONE系列-卡地亚该款产品将山川间奔涌的脉络、岩层里沉淀的肌理,化作可触碰的家 居质感,纹理如天然原石般灵动鲜活,让壮阔自然之美融入日常,切…

卡罗娜瓷砖真·STONE系列-卡地亚:让奢感变得触手可及(卡罗纳瓷砖生产厂家)

车银优回应逃税200亿韩元,发长文道歉称会承担责任(车银优回应逃税争议)

他并不是因恋情丑闻而道歉,但这封信的内容却涉及到一宗震惊『娱乐圈』️的大案——他涉嫌逃税,金额高达200亿韩元(约合人民币1.08亿元)。一部分粉丝为偶像鸣不平,认为他至少正面回应了问题,并承诺配合调查;但更多的声…

车银优回应逃税200亿韩元,发长文道歉称会承担责任(车银优回应逃税争议)

震惊!世界净水器排名前十强揭晓,看看哪款适合你?(净水世界排名第几名呢?)

美的净水器采用了先进的 RO反渗透技术,能够深度净化水质,有效去除水中的溶解性固体、有机物等。海尔净水器采用了多级过滤技术,能够有效去除水中的杂质、余氯和微生物等。它采用了3M 专利的过滤膜技术,能够有效…

震惊!世界净水器排名前十强揭晓,看看哪款适合你?(净水世界排名第几名呢?)

百万网红“小黑妮”顺利产女 异域面孔的河南话博主喜迎千金

1月30日,河南百万博主“小黑妮”在『社交媒体』上发布视频宣布即将生产,并在评论区回复网友称生了女儿。范梓鹤是巴基斯坦人,从小被一对河南农村夫妇收养,因外貌差异常受到异样眼光,一度不爱说话,有些抑郁。2023年11月,她的一则视频意外走红

百万网红“小黑妮”顺利产女 异域面孔的河南话博主喜迎千金