谷歌《Agents》白皮书(the next google)

智能体:生成式 AI 的能力拓展者

在生成式 AI 飞速发展的当下,智能体(Agents)作为其重要拓展,正逐渐成为研究与应用的焦点。

一、核心定义

(一)智能体的本质

智能体可以被定义为一种自主的、以目标为导向的应用,它通过观察环境并调用工具来实现目标。其核心特性包括自主性、主动推理以及与环境的互动能力。这种智能体聚焦于以语言模型为核心的应用,而非广义的 AI 智能体。

智能体的三大核心组件是模型(Model)、工具(Tools)和编排层(Orchestration Layer)。模型作为决策中枢,负责推理、规划及工具选择,能够采用不同的推理框架来指导行动。工具是智能体与外部世界互动的桥梁,包括扩展(Extensions)、函数(Functions)和数据存储(Data Stores)等多种类型。编排层则负责管控信息处理、推理和行动的循环过程,同时维护记忆和状态。

与传统生成式模型相比,智能体的核心差异在于其能力边界和交互方式。智能体能够通过工具与外部系统进行实时交互,而传统模型则受限于其训练数据。

二、智能体的工作原理

(一)工作原理类比

智能体的工作原理可以类比为一位忙碌的大厨。大厨在厨房中需要明确目标(制作美味菜肴),收集信息(食材和顾客需求),进行内部推理(如何烹饪),执行行动(烹饪过程),并根据反馈进行调整(优化菜肴)。类似地,智能体通过目标设定、信息收集、内部推理、执行行动和观察调整等步骤来实现其目标。

(二)三大主流推理框架

ReAct:将推理与行动紧密结合,减少幻觉,提高输出结果的准确性和可靠性。

思维链(Chain-of-Thought, CoT):通过分解复杂问题为多个中间步骤,提升逻辑推理的准确性,适用于需要逐步分析的场景。

思维树(Tree-of-Thoughts, ToT):探索多条可能的路径,支持复杂问题的解决,适用于需要多路径探索的任务。

这三种推理框架为智能体提供了不同的推理方式,可以根据具体任务的需求进行选择和组合。

(三)智能体连接外部的三大核心工具

扩展(Extensions):简化智能体与 API 的交互,通过示例指导智能体动态选择合适的工具,支持复杂规划和实时信息获取。

函数调用(Function Calling):在客户端执行 API 调用,适用于需要安全控制、异步处理或数据预处理的场景,为开发者提供更细粒度的控制。

数据存储(Data Stores):作为外部记忆库,通过 RAG 技术解决知识过时问题,确保智能体能够基于最新信息进行决策和行动。

三、提升智能体性能:三大靶向学习方法

为了进一步提升智能体的性能,靶向学习方法显得尤为重要。这些方法包括:

在上下文中学习(In-context learning):通过在推理时提供示例和工具,让模型“即时学习”如何使用工具。

基于检索的上下文学习(Retrieval-based in-context learning):动态检索相关信息、工具和示例,结合外部知识库,提升模型的推理能力。

基于微调的学习(Fine-tuning based learning):通过在特定数据集上进行微调,让模型提前学习如何使用工具,适用于需要高精度的任务。

结合使用这些方法可以实现优势互补,提升智能体在复杂任务中的表现。

四、总结与未来展望

(一)核心要点总结

智能体扩展了生成式 AI 的能力边界:通过工具与外部世界互动,智能体能够完成复杂的任务。

编排层是智能体的核心:管控信息、推理和行动的循环,确保智能体高效运行。

工具是连接现实世界的关键:根据具体场景选择合适的工具类型,如扩展、函数调用或数据存储。

靶向学习提升模型的工具使用能力:通过多种学习方法,增强智能体在实际任务中的表现。

(二)未来展望

智能体链(Agent Chaining):将复杂任务拆解并分配给多个专业智能体,实现更高效的任务执行和更精准的结果输出。

更强大的工具交互:支持多模态工具和对物理设备的控制,拓展智能体在现实世界中的应用范围。

更优的推理能力:融合记忆增强和多模态信息处理,提升智能体对复杂情况的理解和应对能力。

智能体开发的迭代性:智能体的开发是一个持续优化的过程,需要不断实验和调整以适配具体业务需求。

智能体作为生成式 AI 的重要延伸,正在不断拓展其能力边界。随着技术的不断进步,智能体将在更多领域发挥重要作用,为人类社会的发展创造更多价值。

特别声明:[谷歌《Agents》白皮书(the next google)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

新手直播流量卡话术打印,高转化流量卡促单话术(开直播流量卡)

直播话术绝非简单的推销脚本,它是连接主播与观众的桥梁,是引导用户从观望到下单的路线图。 •套餐详情:月租费用、流量额度(通用流量与定向流量的区别)、通话时长•覆盖范围:网络支持情况、漫游费用•优惠条款:首月…

新手直播流量卡话术打印,高转化流量卡促单话术(开直播流量卡)

采购软件技术实力榜:AI采购+『数字化』转型(选型攻略)(软件采购项目)

本次排名采用五维评估体系:技术能力(权重30%)考察AI应用深度、系统架构稳定性、功能迭代速度;业务覆盖(权重25%)评估行业解决方案数量、采购场景适配度、生态伙伴资源;服务能力(权重20%)衡量实施经验、…

采购软件技术实力榜:AI采购+『数字化』转型(选型攻略)(软件采购项目)

注射用单唾液酸四己糖神经节苷脂钠使用不当会产生什么不良反应(注射用单唾液酸四己糖神经节苷脂钠能用什么药代替)

注射用单唾液酸四己糖神经节苷脂钠为药物通用名,商品名称一般为博司捷。注射用单唾液酸四己糖神经节苷脂钠是一种神经营养剂,主要作用是促进受损神经细胞修复。该药主要用于治疗血管性或外伤性中枢『神经系统』损伤以及帕金森病。

注射用单唾液酸四己糖神经节苷脂钠使用不当会产生什么不良反应(注射用单唾液酸四己糖神经节苷脂钠能用什么药代替)

2025Top4移民生活英语口语高频实用表达口语工具App真实爆款(2025年移民趋势)

这四款APP各有亮点:咕噜口语技术领先,场景覆盖广、性价比高,还以游戏化学习增强趣味性;Elsa Speak凭智能评测和个性化计划助力口语提升;Tandem通过真实语言伙伴实现场景化练习;Loora虽信息…

2025Top4移民生活英语口语高频实用表达口语工具App真实爆款(2025年移民趋势)

为什么用一句绝情英语文案句子就能戳中痛点?如何写出让人难忘的英文文案?#绝情英语文案句子 #英文文案技巧(为什么以绝句为题)

绝情英语文案常用于商业场合,如营销、广告、分手信等。好的绝情文案不仅能让客户印象深刻,还能提高转化率,提升品牌形象。本文教你如何写出优秀的绝情英语文案,避免常见的误区。无论你是外贸从业者、文案策划师还是英语学习者,都值得一读。

为什么用一句绝情英语文案句子就能戳中痛点?如何写出让人难忘的英文文案?#绝情英语文案句子 #英文文案技巧(为什么以绝句为题)