老板与员工:5分钟理解 Subagent 架构
一、为什么 AI 做复杂任务,总是越做越偏?
很多人用 Claude Code 或 OpenClaw 处理复杂任务时都遇到过这个现象:任务开始时表现不错,但越往后越离谱:忽略之前的约束、重复已经做过的步骤、把早期提到的细节搞错。
直觉上会觉得是模型变差了,但其实不是。这是架构问题。
二、一次典型的失败
设想一个多步骤任务:抓取今日 AI 新闻 → 筛选整理 → 写成日报草稿 → 审核修改 → 转换成各平台格式 → 提交发布。
让单个主 Agent 从头跑到尾,大概从第三步开始就会出现漂移。
原因很简单:上下文窗口是有限的。任务执行过程中产生的中间输出——思考过程、代码片段、报错信息——会持续塞进同一个窗口。200K token 听起来很大,但当窗口达到三分之二的容量时,最开始的需求细节、约束条件、关键背景,就会被稀释到注意力触及不到的地方。
三、解决办法:老板与员工
解法是 Subagent 架构。一句话概括:主 Agent 是老板,Subagent 是有干净脑子的员工。
干净的上下文
每个 Subagent 启动时都带着一个全新的上下文窗口,只装这次任务需要的信息,不背负主 Agent 积累的所有历史。这就是"干净脑子"的含义——不是更聪明,而是没有包袱。
任务书而非对话
主 Agent 给 Subagent 分配任务时,靠的是一份明确的任务书,而不是共享上下文。Subagent 完成后,把结果摘要汇报回来,主 Agent 只需要消化结论,不需要重放整个执行过程。
这和普通的工具调用(Tool Call)不同——工具调用只是函数执行,上下文还是同一个;Subagent 是独立进程,有自己的推理空间。
对应关系
管理概念Subagent 架构老板拆解项目,分配任务主 Agent 规划并派发子任务员工只知道自己负责的那块Subagent 持有独立上下文员工汇报结果,不汇报过程Subagent 返回摘要,不暴露中间状态多个员工并行工作多个 Subagent 并发执行找专人做专事为不同子任务定制不同 Prompt,给 Subagent 一份干净且精准的任务书核心逻辑
分层委派不是 AI 特有的发明。人类组织几千年来用层级结构处理复杂问题,本质上也是在应对个体注意力的上限:
- 军事指挥:罗马军团的士兵 → 百夫长 → 千人队长 → 将军,每层只需盯住直属下级,皇帝不需要知道每个士兵的动向。
- 宗教组织:天主教会的教皇 → 红衣主教 → 主教 → 神父 → 信徒,梵蒂冈一个人管不了全球十几亿信众,但通过层级可以做到。
- 封建制度:国王 → 诸侯 → 骑士 → 农民,国王只需管几十个诸侯,诸侯管几十个骑士,把"注意力"分摊到各层。
- 现代企业:CEO 的认知带宽有限,所以有 VP、Director、Manager——每层管理者只关注大约 5–8 个直接下属。
Subagent 架构只是把同样的逻辑搬到了 AI 系统里。
真实案例
以我自己搭的 AI 日报工作流为例,简化后的结构长这样:- Step 1:数据采集(主 Agent 自己跑脚本)
- Step 2:撰写 Newsletter 草稿(主 Agent 自己写)
- Step 3:启动 @newsletter-editor(专门负责内容审查和修改的 Subagent),传入草稿路径,等修改完成
- Step 4:同时启动 @twitter-formatter(专门负责转换为 Twitter Thread 格式的 Subagent)
- 和 @wechat-formatter(专门负责转换为微信公众号格式的 Subagent),
- 各自传入 newsletter 路径(单条消息并行调用,等全部完成后继续)
- Step 5:提交发布
复制代码 对照上面的表格逐行验证:
- 员工只知道自己负责的那块:@newsletter-editor 只收到草稿路径,@twitter-formatter 只收到 newsletter 路径,它们都对主流程一无所知。
- 多个员工并行工作:Step 3 的两个 Subagent 同时启动,互不依赖,总耗时取决于较慢的那个。
- 员工汇报结果,不汇报过程:每个 Subagent 把结果写回文件,主 Agent 只检查输出是否存在,不重放任何中间状态。
整个过程下来,主 Agent 的上下文窗口始终保持干净——它只装自己的规划和各步骤的结论,三个 Subagent 产生的所有中间内容(审查意见、格式转换过程)都在各自的窗口里消化,不会回流污染主流程。
四、用法与边界:什么时候该派活,什么时候别派
任务书写清楚,信息不会自动传递
老板脑子里装着所有背景,但员工入职第一天什么都不知道。你觉得"这还用说"的前提条件,对员工来说可能是盲区。
Subagent 也一样。它启动时只有你给它的任务书,主 Agent 积累的所有上下文不会自动流过去。任务书写得含糊,它不会追问背景——或者追问了也问不到——只能靠猜,然后跑偏。
派活之前,先想清楚:换一个什么都不知道的新员工,拿到这份任务书能不能干?
派活本身有成本
雇人、培训、开会对齐,都需要时间。如果只是确认一个会议时间,发条消息自己问比委托员工问快得多。
Subagent 也有启动延迟,汇报摘要也会损耗细节。任务足够简单的时候,这些成本完全不值得。
什么任务适合派,什么不适合
适合派给 Subagent不适合任务性质模块清晰,边界明确步骤之间高度耦合协作方式员工可以自己闷头干完再汇报需要频繁和老板对齐中间状态任务规模足够大,值得专人负责太小,管理成本大于执行成本一句话判断标准:这个任务能不能写成一份清晰的任务书,交出去之后不管它,等结果就行? 能,就派;不能,就自己做。
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |
|
|
|
|
|
相关推荐
|
|
|