多个编码智能体同时使用会不会混乱?海外开发者热议(多智能体编队matlab控制程序)

机器之心报道

编辑:冷猫

AI 编程工具的进步速度正在迅速加快。

如果各位读者从事涉及代码相关的工作,应该很能察觉到近两年 AI 编程能力的进化幅度,GPT-5 和 Gemini 2.5 等最新前沿大模型已经让开发者在实际任务中一定程度实现了自动化,近期发布的 Sonnet 4.5 又再次推动了这一进展。

再结合现在已经非常成熟 CLI、IDE 工具等的辅助,采用编码智能体进行开发工作已经成为了一种常态,甚至成为了一种新的生活方式。

不仅仅是程序员,产品类、设计类岗位的从业人员都已广泛采用 AI 编码智能体辅助工作,AI 生成的代码比例越来越高。

但是,AI 编码智能体仍然存在一些问题,比如代码质量不高,智能体分析效率低下等等。

那么,与其等待智能体分析生成或是多次「抽卡」的低效,有没有可能同时并行使用多个智能体进行工作呢?

Datasette 的创建者,独立开源开发者 Simon Willison 已经成为了同时使用多个编码智能体的开发者。

为此,他发布了一篇全新博客,分享了自己同时运行多个编码 AI 的经历和宝贵经验,引起了海外开发者们广泛的关注,在 X 上的推文已破 10 万阅读量。

  • 博客标题:Embracing the parallel coding agent lifestyle
  • 博客链接:https://simonwillison.net/2025/Oct/5/parallel-coding-agents/

拥抱并行编码代理生活方式

Simon Willison 起初对此是持怀疑态度的。AI 生成的代码必须经过审查,而审查速度天然是瓶颈。光是跟上单个大模型的产出速度就已经很吃力了,如果同时运行多个代理,只会更加落后,那又有什么好处呢?

尽管一开始有顾虑,但过去几周他发现自己其实已经悄然接受了这种「并行编码代理」的工作方式。

在工作中,他发现可以并行启动越来越多的小任务,而不会给主要工作增加太多认知负担。

以下是 Simon Willison 总结的一些高效使用并行代理的模式:

概念验证研究任务

第一个适合并行代理的任务类别是研究。

研究任务用于回答问题或提供建议,而不会直接修改你计划保留的项目代码。

许多软件项目都始于概念验证阶段。例如:能否用 Yjs 和 Python 后端实现一个简单的协作笔记工具?这些库虽然存在,但它们能否顺利协同工作?

如今的编码代理已经能够用新库快速构建原型,验证这些基础性问题。即便新库不在模型的训练数据中也没关系 —— 直接让代理去克隆这些依赖的仓库、阅读代码、自己摸索使用方法。

系统机制回溯

当你需要回忆系统中某一部分的工作原理时,现代的「推理型」大模型能在一两分钟内给出详细且可操作的答案。

无论代码库多大,代理都可以借助诸如 grep 之类的工具,在数十个文件之间追踪调用路径。

你可以让它:

  • 记录签名 cookies 是在哪里设置和读取的;
  • 分析你的应用如何使用子进程与线程;
  • 或指出 JSON API 哪些部分还未被文档覆盖。

这些由 LLM 生成的解释非常值得保存起来 —— 它们可以作为后续 prompt 的上下文材料,非常有价值。

小型维护任务

接下来是真正打算保留的代码修改,尽管它们风险较低。事实证明,有许多小问题只需一点额外的「脑力负担」,这些完全可以交给代理处理。

例如警告⚠️信息(warnings):如果测试套件抛出某个弃用(deprecated)警告⚠️,把它丢给一个代理,让它运行测试、找到并修复问题。你无需中断正在进行的主要任务来解决这种小烦恼。

发现这种机会是一种能力。最好的练习方式就是多尝试 —— 任何小的维护任务都值得交给代理试一试。无论成功或失败,你都能从中学到东西。

精确指定的实际工作

审查一段「从天而降」的代码改动是很费力的。

首先得推测作者的意图:它要解决什么问题?这个问题是否值得解决?方案是否合理、能否与后续计划兼容?这些都需要思考大量高层问题,才能开始看具体实现。

但如果代码是根据你自己写的详细规格说明生成的,那么审查负担就轻得多。当你已经确定了目标、方法和实现细节,只需要验证代理产出的代码是否符合你的要求即可。

现在的使用方式

目前,Willison 的主力工具是:

  • Claude Code(Sonnet 4.5)
  • Codex CLI(GPT-5-Codex)
  • Codex Cloud(用于异步任务,经常直接从手机触发)

此外,还在尝试:

  • GitHub Copilot Coding Agent(集成在 GitHub 网站界面的内置代理)
  • Google Jules(谷歌目前免费的 Codex Cloud 替代方案)

他仍在摸索最适合自己的工作模式,预计还会持续调整。

他经常同时打开多个终端窗口,在不同目录中运行不同的代理实例(通常是 Claude Code 与 Codex CLI 的组合),以 YOLO 模式(无需批准)执行那些安全性可控的任务。

对于风险较高的任务,主要使用异步代理(通常是 Codex Cloud)。这样即便出问题,最糟糕的情况只是源码泄露。

他偶尔也会使用 GitHub Codespaces 来运行 VS Code 的 agent 模式 —— 它出乎意料地高效,且完全在浏览器中运行。这在 workshop 或演示场景中特别好用:只要有 GitHub 账号即可使用,无需额外的 API 密钥。

开发者热议

这篇博客一经发布就受到广泛关注,非常契合现在代码相关开发工作的痛点。越来越多人正在尝试同时使用多个编码智能体进行开发工作。

Google Labs 的产品总监 Kath Korevec 有 80% 左右的编码工作是由 AI 辅助完成的,她同样表达了对并行智能体工作流的热情。

还有一些开发者分享了自己关于并行智能体开发范式的理解:

当然,很多开发者表达了一些担忧的声音,尤其是关于智能体生成代码产生的不可控因素:

更多开发者讨论,可以关注原推文:

https://x.com/simonw/status/1974835974938206222

特别声明:[多个编码智能体同时使用会不会混乱?海外开发者热议(多智能体编队matlab控制程序)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

透明守护者:方形双节18650电池收纳盒的革命性设计

在追求便携与安全的时代,一款看似简单的18650电池收纳盒正悄然改变着电子设备爱好者和专业人士的生活方式。这款方形透明收纳盒专为两节18650锂电池设计,不仅提供全方位保护,更赋予使用者随时掌握电池状态的能力。它不仅是充电管理的创新,更是对

透明守护者:方形双节18650电池收纳盒的革命性设计

专业的去痘产品?痘痘 “偷袭” 脸蛋?这瓶 “精准反击” 不留痕(去痘产品真的有用吗)

【核心祛痘成分】:里面的包裹水杨酸太懂『敏感肌』了,不像普通水杨酸一用就刺痛,它能 4 天慢慢剥掉老废角质,还能把致痘的痤疮丙酸杆菌拦住 90% 以上,减少油脂分泌。我用着觉得它『补水』抗老一步到位,性价比很高,新…

专业的去痘产品?痘痘 “偷袭” 脸蛋?这瓶 “精准反击” 不留痕(去痘产品真的有用吗)

繁花》后续影响来了!『唐嫣』被曝新剧延迟开机,杂志封面取消拍摄(繁花原著)

但如果这部剧和奖项以后都变得“不便提及”,对她来说,这几年的努力和成绩,可能一下子就要大打折扣了。有说法是,这两部剧的投资方打算一起处理播出的事情,所以时间上就延后了。这么一来,『唐嫣』在2025年确定能播出的作…

《<strong>繁花</strong>》后续影响来了!『唐嫣』被曝新剧延迟开机,杂志封面取消拍摄(繁花原著)

看破不说破!被骂12年的『易烊千玺』,如今的处境让人毫不意外(看破不说破的下句)

在大家看来,『宋佳』的获奖作品《好东西》,更多是胜在剧本和题材的深刻,若单论演技,『咏梅』的表现似乎更深入人心。之后,『咏梅』在『社交媒体』上更新了一句话:“新的一天,该有的都有。”但不得不承认,这届金鸡奖的影帝影后作品,在…

看破不说破!被骂12年的『易烊千玺』,如今的处境让人毫不意外(看破不说破的下句)

江浙沪新晋亲子地标:探秘好孩子·元生态馆,解锁科技美学拉满的周末(江浙沪亲子游景点排名)

好孩子核心技术在此清晰呈现——宇航吸能技术将碰撞测试标准提升至80kmh;而与之协同的气囊技术则以“毫秒级响应”守护宝宝安全——从抽象成为可见,技术变成可视化信任。同时将宇航吸能等全球领先硬核科技,转化为…

江浙沪新晋亲子地标:探秘好孩子·元生态馆,解锁科技美学拉满的周末(江浙沪亲子游景点排名)