多个编码智能体同时使用会不会混乱?海外开发者热议(智能编码系统)

(来源:机器之心)

AI 编程工具的进步速度正在迅速加快。

如果各位读者从事涉及代码相关的工作,应该很能察觉到近两年 AI 编程能力的进化幅度,GPT-5 和 Gemini 2.5 等最新前沿大模型已经让开发者在实际任务中一定程度实现了自动化,近期发布的 Sonnet 4.5 又再次推动了这一进展。

再结合现在已经非常成熟 CLI、IDE 工具等的辅助,采用编码智能体进行开发工作已经成为了一种常态,甚至成为了一种新的生活方式。

不仅仅是程序员,产品类、设计类岗位的从业人员都已广泛采用 AI 编码智能体辅助工作,AI 生成的代码比例越来越高。

但是,AI 编码智能体仍然存在一些问题,比如代码质量不高,智能体分析效率低下等等。

那么,与其等待智能体分析生成或是多次「抽卡」的低效,有没有可能同时并行使用多个智能体进行工作呢?

Datasette 的创建者,独立开源开发者 Simon Willison 已经成为了同时使用多个编码智能体的开发者。

为此,他发布了一篇全新博客,分享了自己同时运行多个编码 AI 的经历和宝贵经验,引起了海外开发者们广泛的关注,在 X 上的推文已破 10 万阅读量。

  • 博客标题:Embracing the parallel coding agent lifestyle

  • 博客链接:https://simonwillison.net/2025/Oct/5/parallel-coding-agents/

拥抱并行编码代理生活方式

Simon Willison 起初对此是持怀疑态度的。AI 生成的代码必须经过审查,而审查速度天然是瓶颈。光是跟上单个大模型的产出速度就已经很吃力了,如果同时运行多个代理,只会更加落后,那又有什么好处呢?

尽管一开始有顾虑,但过去几周他发现自己其实已经悄然接受了这种「并行编码代理」的工作方式。

在工作中,他发现可以并行启动越来越多的小任务,而不会给主要工作增加太多认知负担。

以下是 Simon Willison 总结的一些高效使用并行代理的模式:

概念验证研究任务

第一个适合并行代理的任务类别是研究。

研究任务用于回答问题或提供建议,而不会直接修改你计划保留的项目代码。

许多软件项目都始于概念验证阶段。例如:能否用 Yjs 和 Python 后端实现一个简单的协作笔记工具?这些库虽然存在,但它们能否顺利协同工作?

如今的编码代理已经能够用新库快速构建原型,验证这些基础性问题。即便新库不在模型的训练数据中也没关系 —— 直接让代理去克隆这些依赖的仓库、阅读代码、自己摸索使用方法。

系统机制回溯

当你需要回忆系统中某一部分的工作原理时,现代的「推理型」大模型能在一两分钟内给出详细且可操作的答案。

无论代码库多大,代理都可以借助诸如 grep 之类的工具,在数十个文件之间追踪调用路径。

你可以让它:

  • 记录签名 cookies 是在哪里设置和读取的;

  • 分析你的应用如何使用子进程与线程;

  • 或指出 JSON API 哪些部分还未被文档覆盖。

这些由 LLM 生成的解释非常值得保存起来 —— 它们可以作为后续 prompt 的上下文材料,非常有价值。

小型维护任务

接下来是真正打算保留的代码修改,尽管它们风险较低。事实证明,有许多小问题只需一点额外的「脑力负担」,这些完全可以交给代理处理。

例如警告⚠️信息(warnings):如果测试套件抛出某个弃用(deprecated)警告⚠️,把它丢给一个代理,让它运行测试、找到并修复问题。你无需中断正在进行的主要任务来解决这种小烦恼。

发现这种机会是一种能力。最好的练习方式就是多尝试 —— 任何小的维护任务都值得交给代理试一试。无论成功或失败,你都能从中学到东西。

精确指定的实际工作

审查一段「从天而降」的代码改动是很费力的。

首先得推测作者的意图:它要解决什么问题?这个问题是否值得解决?方案是否合理、能否与后续计划兼容?这些都需要思考大量高层问题,才能开始看具体实现。

但如果代码是根据你自己写的详细规格说明生成的,那么审查负担就轻得多。当你已经确定了目标、方法和实现细节,只需要验证代理产出的代码是否符合你的要求即可。

现在的使用方式

目前,Willison 的主力工具是:

  • Claude Code(Sonnet 4.5)

  • Codex CLI(GPT-5-Codex)

  • Codex Cloud(用于异步任务,经常直接从手机触发)

此外,还在尝试:

  • GitHub Copilot Coding Agent(集成在 GitHub 网站界面的内置代理)

  • Google Jules(谷歌目前免费的 Codex Cloud 替代方案)

他仍在摸索最适合自己的工作模式,预计还会持续调整。

他经常同时打开多个终端窗口,在不同目录中运行不同的代理实例(通常是 Claude Code 与 Codex CLI 的组合),以 YOLO 模式(无需批准)执行那些安全性可控的任务。

对于风险较高的任务,主要使用异步代理(通常是 Codex Cloud)。这样即便出问题,最糟糕的情况只是源码泄露。

他偶尔也会使用 GitHub Codespaces 来运行 VS Code 的 agent 模式 —— 它出乎意料地高效,且完全在浏览器中运行。这在 workshop 或演示场景中特别好用:只要有 GitHub 账号即可使用,无需额外的 API 密钥。

开发者热议

这篇博客一经发布就受到广泛关注,非常契合现在代码相关开发工作的痛点。越来越多人正在尝试同时使用多个编码智能体进行开发工作。

Google Labs 的产品总监 Kath Korevec 有 80% 左右的编码工作是由 AI 辅助完成的,她同样表达了对并行智能体工作流的热情。

还有一些开发者分享了自己关于并行智能体开发范式的理解:

当然,很多开发者表达了一些担忧的声音,尤其是关于智能体生成代码产生的不可控因素:

更多开发者讨论,可以关注原推文:

https://x.com/simonw/status/1974835974938206222

特别声明:[多个编码智能体同时使用会不会混乱?海外开发者热议(智能编码系统)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

厨房家电辅助装置解析:电饭煲置物架与微波炉支架详解(做厨房电器安装挣钱吗)

本文全面解析厨房家电辅助装置中的电饭煲置物架与微波炉支架。包括其定义分类、技术原理、历史发展、应用场景、技术特性、优缺点及行业现状。这些设备为现代厨房提供了高效的储物解决方案,旨在帮助用户更好地整理厨房空间并提升使用便捷性。

厨房家电辅助装置解析:电饭煲置物架与微波炉支架详解(做厨房电器安装挣钱吗)

重磅!出道18年少女时代首位婚恋成员诞生,她的选择让人意外吗?(2018年出道的艺人)

韩国『娱乐圈』️迎来一则重磅消息——少女时代成员黄美英(Tiffany)与演员卞耀汉通过双方经纪公司正式承认恋情,并罕见地明确表示"正在以结婚为前提真挚交往"。 两人均处于个人事业的上升期,此时公开以结婚为目标

重磅!出道18年少女时代首位婚恋成员诞生,她的选择让人意外吗?(2018年出道的艺人)

供应链风向突变:iPhone 17 Pro弃用国产屏,尴尬了谁?(供应链风向突变是指)

按照消息源说法,京东方计划在2025年第三季度初向苹果供应1000多万块iPhone 17 ProOLED屏幕,但是未能解决技术问题,导致这些面板可靠性、良率与性能无法满足苹果对LTPO OLED面板的性…

供应链风向突变:iPhone 17 Pro弃用国产屏,尴尬了谁?(供应链风向突变是指)

年轻的小姨子4》:不是亲人胜似亲,韩国伦理片的烟火温情

多恩用自己的美术特长,帮敏宇完成了被他搞砸的手工课作业——一座用废旧材料搭建的“城堡”,让敏宇在班级里获得了表扬;她发现成宰的汽修店宣传单设计粗糙,主动利用专业知识为他重新设计了宣传海报,简洁明了的风格让店铺…

《<strong>年轻的小姨子4</strong>》:不是亲人胜似亲,韩国伦理片的烟火温情

卫生间🚻隔断支撑脚304不锈钢配件如何选?看这篇就够了 | 公共空间设计新国标解读(卫生间🚻隔断支撑脚怎么安装)

公共厕所的卫生间🚻隔断支撑脚是影响耐用性和安全性的关键部件。选择合适的304不锈钢材质和厚度对于公共空间的设计至关重要。本文从材质、安装细节、成本考量等多角度分析,并揭示2025公共空间新国标的变化,助您找到最优质的选择。

卫生间🚻隔断支撑脚304不锈钢配件如何选?看这篇就够了 | 公共空间设计新国标解读(卫生间🚻隔断支撑脚怎么安装)