Claude Code Agent Teams
0. 写在前面
在上一篇 [[Claude Code]] 里,我更多是把 Claude Code 当成一个“终端里的全栈 AI 工程师”来用。
但当任务开始变复杂之后,单会话模式很快会遇到几个典型问题:
- 一个会话既要读需求、又要改代码、还要跑测试,上下文容易被冲散;
- 多个子任务串行执行,等待时间长;
- 同一个 Agent 同时承担架构、实现、验证、文档,角色切换成本高;
- 大任务做到一半时,主会话里会塞满中间分析,可读性和可控性都会下降。
这时候,Agent Teams 的价值就出来了。
它不是简单地“多开几个 Claude Code 窗口”,而是把多个 Claude Code 会话组织成一个带分工、可协作、可汇总的团队。你可以把它理解为:
你 -> Team Lead(主会话) ├── Teammate A:架构分析 ├── Teammate B:后端实现 ├── Teammate C:前端实现 └── Teammate D:测试验证Agent Teams 目前仍然是实验性功能,但已经非常适合复杂开发任务、并行研究、批量审查和大规模重构这类工作。

1. 什么是 Agent Teams
Agent Teams 是 Claude Code 的实验性多智能体协作能力。一个主会话作为 Team Lead,可以创建多个 Teammates,把复杂任务拆成多个子任务并行执行,再由 Team Lead 汇总结果。
核心能力
- 并行执行:多个队友同时处理不同任务;
- 共享任务列表:团队成员可以看到当前任务状态;
- 直接通信:Team Lead 可以直接和某个 teammate 对话;
- 上下文隔离:每个 teammate 有自己的独立上下文,避免主会话被细节淹没;
- 权限继承:teammate 会继承 Team Lead 的权限模式、MCP、Skills、
CLAUDE.md等上下文能力。
当前官方要求
根据当前官方文档,使用 Agent Teams 需要注意:
- 需要 Claude Code v2.1.32+
- 需要显式开启实验开关
- 目前一个会话只能创建一个团队
- 团队里不能再嵌套新的团队
- 它更适合复杂、可拆分、可并行的任务,不适合简单的一步到位任务
2. Agent Teams 和 Subagents 的区别
很多人第一次看到这个功能,会把它和 Subagents 混在一起。实际上两者定位不一样。
| 对比项 | Agent Teams(团队) | Subagents(子代理) |
|---|---|---|
| 定位 | 多个 Claude Code 会话组成的团队 | 单个会话内调用的子代理 |
| 适合任务 | 长任务、复杂任务、需要并行的大任务 | 短任务、局部任务、临时委托 |
| 协作方式 | Team Lead + 多个 teammates | 主 Agent 调用多个子代理 |
| 上下文 | 每个 teammate 独立上下文 | 仍然围绕单会话工作 |
| 可见性 | 可查看团队、任务、成员状态 | 更偏内部调用 |
| 成本 | 更高 | 相对更低 |
一句话总结:
- Subagents 更像“我手下的几个专员”;
- Agent Teams 更像“我临时拉起的一个项目组”。
如果你只是想让 Claude Code 帮你查一个文件、写一个函数、补一个测试,没必要上 Agent Teams。
但如果你要做的是:
- 跨前后端的大功能开发
- 大型重构
- 代码审查 + 修复 + 测试联动
- 多方向并行研究
那 Agent Teams 会明显更顺手。
3. Agent Teams 的核心工作机制
3.1 团队结构
┌────────────────────────────────────────────┐│ Team Lead ││ 负责理解需求、拆解任务、分配工作、汇总结果│└───────────────┬────────────────────────────┘ │ ┌───────────┼───────────┬───────────┐ │ │ │ │ ▼ ▼ ▼ ▼┌────────┐ ┌────────┐ ┌────────┐ ┌────────┐│架构队友│ │后端队友│ │前端队友│ │测试队友│└────────┘ └────────┘ └────────┘ └────────┘ │ ▼ Shared Task List (pending / in_progress / completed)3.2 共享任务列表
官方文档里,Agent Teams 的一个关键设计就是 Shared Task List。它不是简单的待办事项,而是团队成员协同的状态面板。
常见状态包括:
pendingin_progresscompleted
这个机制的价值在于:
- Team Lead 能知道谁正在做什么;
- teammate 之间能避免重复劳动;
- 在大任务里更容易控制依赖关系;
- 对多轮长任务来说,可追踪性明显更强。
3.3 直接消息通信
Agent Teams 不是完全中心化的“总控台 + 工作者”模式。
在当前官方设计里,teammates 之间可以直接通信,而不是所有消息都必须经过 Team Lead 转发。这样做的好处是:
- 架构队友可以直接和实现队友对齐接口;
- 测试队友可以直接向实现队友反馈失败点;
- Team Lead 不需要处理所有细节通信,减轻主会话压力。
3.4 上下文隔离
这是我认为 Agent Teams 最重要的一点。
单会话最大的痛点,是所有内容都在一个上下文里竞争注意力。任务一多,主会话很容易变成:
1. 关键信息的“噪音干扰”
当所有的架构讨论、代码块、终端报错和 Git Diff 挤在一起时,AI 的**注意力机制(Attention Mechanism)**会被稀释。
-
现象: 你在讨论一个深层的逻辑 Bug,但上下文里充斥着前 10 分钟产生的 500 行测试日志。
-
后果: AI 可能会忽略你刚提出的核心约束,转而根据过时的报错信息给出错误的建议。这就好比在一个吵闹的菜市场里谈代码架构,核心信息被噪音盖过了。
2. Token 窗口的“通货膨胀”
单会话就像一个不断膨胀的记事本。
-
现象: 每一次简单的对话,AI 都要重新读取一遍之前所有的
npm install输出和冗长的代码 Diff。 -
后果: * 响应变慢: 处理的 Token 越多,推理延迟越高。
-
费用飙升: 每次回复都在为那些已经没用的历史日志付费。
-
遗忘曲线: 随着会话变长,最早定义的全局架构原则可能会被挤出有效窗口。
-
3. “读写冲突”导致的逻辑混乱
在单会话中,AI 既是“思考者”又是“执行者”。
-
现象: AI 正在修改
auth.py,同时你又让它去查database.sql的结构。 -
后果: 由于只有一个主循环,AI 必须停下手中的修改去执行查询。这种上下文切换会导致它在回来继续写代码时,丢失掉刚才对逻辑细微之处的“手感”,从而产生低级语法错误或逻辑断层。
4. 人的认知负荷过载
不仅 AI 会乱,人也会乱。
-
现象: 当你向上滚动屏幕寻找 5 分钟前的一条 API 定义时,你需要划过几十屏的命令输出。
-
后果: 你很难一眼看出当前的进度。哪些任务完成了?哪些还在等待?在一个滚屏不断的单窗口里,复盘和校对代码修改(Review Diff)变得极其痛苦。
最后的结果就是:主会话既长又乱。
Agent Teams 把这些内容分散到不同 teammate 的独立上下文中,Team Lead 只在必要时接收摘要、结论和关键结果,这样主线会清楚很多。
4. 启用方式与基础配置

4.1 启用实验功能
按照当前官方文档,推荐在 settings.json 中配置环境变量:
C:\Users\Administrator\.claude{ "env": { "CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS": "1" }}也可以直接使用环境变量方式开启。
4.2 版本检查
先确认 Claude Code 版本是否足够新:
PS C:\Users\Administrator> claude --version2.1.74 (Claude Code)如果版本低于官方要求,就先升级,否则后面很多行为和界面都可能对不上。
4.3 显示模式
当前官方文档提到,Agent Teams 有不同的 teammate 显示模式。
- 默认是
auto - 如果终端支持,可以使用
tmux相关模式看到分屏效果

需要注意的是,官方当前明确提到:
- VS Code 集成终端
- Windows Terminal
- Ghostty
这些环境不支持 split-pane teammate display。
4.4 首次创建团队
启用后,你可以直接用自然语言告诉 Claude Code:
创建一个 4 人的开发团队:1. 架构师,负责方案拆解和边界确认2. 后端工程师,负责 API 和数据层修改3. 前端工程师,负责页面和接口联调4. QA 工程师,负责测试方案和回归验证
请先输出任务拆解,再开始执行。如果是复杂任务,后面可以在加补充:
在开始改代码前,先让架构师给出文件边界、接口契约和风险点,经过我确认后再进入实现阶段。这一步很关键。因为一旦你让多个 teammate 直接开工,而没有先做边界约束,文件冲突、重复修改和返工会非常常见。
5. 开发一个语音转弹幕的项目
需求描述:通过微信小程序语音输入,在web界面可以看到文字弹幕
5.1 阶段一:先做拆解,再做实现
这边我没有用teams来写PRD,我在外面另外用 Gemini 生成了一份需求文档,这样可以马上微调
提示词:
请确认我的以下请求。请以产品经理的身份回复我。我会提供一个主题,您将协助我根据以下标题编写一份PRD文档:主题、简介、问题陈述、目标与目的、用户故事、技术需求、收益、关键绩效指标(KPI)、开发风险、结论。在我针对某个具体主题、功能或开发请求您编写之前,请不要主动撰写任何PRD文档。
5.2 阶段二:按文件归属并行实现
需求确认后,再分配实现类任务:
我想开发一个语音转弹幕的项目。
创建一个团队来协作开发:
团队成员分工:- Teammate A(后端开发):设计整体架构,对接转译api,写接口给小程序和web界面- Teammate B(小程序开发):使用uni-app加vue3来开发微信小程序前端界面- Teammate C(web前端开发):使用vue3来实现web界面显示弹幕功能- Teammate D(UI/UX设计):设计小程序和web的ui,使用skill UI ux pro max- Teammate E(测试):测试网页是否正常
技术要求:- 后端使用 java- 小程序使用uni-app加vue3- web使用使用vue3
请先让架构师设计整体方案,定义好数据结构后,其他成员再并行开发。这时候 Agent Teams 的并行优势才会真正发挥出来。
team-leader(项目管理)

Architect(架构师)

Dev(开发人员)
backend-dev\miniprogram-dev\ui-designer\web-dev

团队协作

5.3 阶段三:汇总与回归

最后可以汇总一下:
- Team Lead 汇总每个 teammate 的产出
- QA 队友统一给出测试结果
- 架构队友确认没有偏离最初设计
- Team Lead 再输出最终结论
参考提示词:
停止新增修改,开始汇总:
1. 每个 teammate 用 5 条以内总结自己的工作2. QA 队友列出已验证项、未验证项和风险点3. Team Lead 输出最终交付摘要: - 改了什么 - 为什么这样改 - 还有哪些风险 - 下一步建议效果


6. 适用场景

场景一:多角度代码审查
创建一个 agent team 审查这个 PR:- 安全审查者:检查注入、XSS、权限等安全问题- 性能审查者:分析 N+1 查询、内存泄漏、缓存策略- 测试审查者:验证测试覆盖率和边界情况让他们各自审查后汇报发现。为什么适合 Agent Teams: 三个审查维度完全独立,不会产生文件冲突,可以并行执行。
场景二:新功能模块并行开发
创建一个团队来构建用户通知系统:
队友 1:开发后端 API(src/api/notifications/)队友 2:开发前端组件(src/components/notifications/)队友 3:编写集成测试(tests/notifications/)为什么适合: 每个队友负责不同目录,天然隔离,完成后合并即可。
场景三:竞争假设调试
有一个间歇性 Bug,创建 team 用不同假设调试:- 队友 A:调查是否是竞态条件- 队友 B:调查是否是内存泄漏- 队友 C:调查是否是第三方 API 超时各自独立验证假设并汇报。为什么适合: 对抗式调试,多条线索并行排查,谁先找到根因谁赢。
场景四:跨层修改协调
当一个改动横跨前端、后端和数据库时,Agent Teams 可以让每层的专家各司其职,通过消息系统协调接口定义。
场景五:探索性研究
我在设计一个 CLI 工具来追踪代码中的 TODO 注释。创建一个团队从不同角度探索:- 一个队友负责用户体验设计- 一个队友负责技术架构- 一个队友扮演"质疑者"(devil's advocate)为什么适合: 多视角碰撞,互相挑战对方的假设和结论。
7. Claude Agent Teams 与 Subagent 选择指南
| 判断维度 | 选 Subagent | 选 Agent Teams |
|---|---|---|
| 队友需要互相沟通? | 不需要 | 需要 |
| 任务是否可并行? | 部分可以 | 高度并行 |
| 是否涉及多文件编辑? | 同文件安全 | 需分工避免冲突 |
| 任务复杂度? | 聚焦单一目标 | 多角度、多模块 |
| Token 预算? | 更省 | 约 3-7 倍消耗 |
| 是否需要讨论/质疑? | 不需要 | 需要 |
成本参考: 一个 3 人 Agent Teams 团队运行 30 分钟,Token 消耗约为单个会话的 3-4 倍。Plan 模式下约 7 倍。
8. 优势与局限
8.1 优势
| 优势 | 说明 |
|---|---|
| 并行能力强 | 多个 teammate 同时执行,适合复杂任务 |
| 上下文更清晰 | 每个 teammate 独立上下文,主线更干净 |
| 角色分工自然 | 更接近真实研发团队协作方式 |
| 适合长任务 | 大任务不容易把单会话拖乱 |
| 汇总质量更高 | Lead 负责归纳,而不是所有内容都自己生成 |
8.2 局限
| 局限 | 说明 |
|---|---|
| 仍是实验性功能 | 官方说明当前仍在迭代中,行为和配置可能变化 |
| 成本更高 | 官方文档明确提到 token 消耗会显著增加 |
| 调度更复杂 | 团队越大,越需要明确边界和流程 |
| 不适合简单任务 | 小任务强行用团队,收益很低 |
| 终端展示有限 | 当前并不是所有终端都支持分屏显示 |
8.3 成本
这点必须单独说。
官方文档已经明确提示:Agent Teams 会显著增加 token 消耗。Anthropic 的工程文章里,在多智能体研究系统实验中也提到,多智能体在效果更好的同时,通常也伴随更高的资源消耗。
所以正确的使用姿势不是“所有任务都上 Agent Teams”,而是:
- 简单任务:单会话或 subagents
- 中等复杂任务:2 到 3 个 teammates
- 复杂且可并行任务:Agent Teams
这才是比较合理的性价比。
9. 总结
Claude Code Agent Teams 的意义,不在于“能同时开几个 Agent”,而在于它把 Claude Code 从单兵作战推进到了团队协作。
它解决的不是“Claude 会不会写代码”,而是:
- 当任务足够大时,怎么拆;
- 当角色足够多时,怎么分;
- 当信息足够杂时,怎么控;
- 当结果需要汇总时,怎么收。
如果说单会话 Claude Code 更像一个能力很强的工程师,那么 Agent Teams 更像一个可以临时组建的小型研发团队。
对复杂开发任务来说,这个方向非常值得关注。
但同样要保持克制:
- 它是实验性功能;
- 它并不便宜;
- 它不适合所有任务;
- 它需要更强的任务拆解能力。
真正用好它的人,不是“把任务一股脑扔给 4 个 Agent”,而是知道什么时候该拆、拆成什么样、怎么让团队不互相踩脚。
参考资料
Claude Code 官方文档:Agent Teams(中文)
Anthropic Engineering:How we built our multi-agent research system
Datawhale Easy Vibe:Agent Teams 多代理协作