返回首页
coding2026-02-23

OpenClaw + Codex Agent Swarm:一人开发团队完整搭建指南

作者: Elvis (@elvissun)查看原文
AD SLOT — TOP

我不再直接使用 Codex 或 Claude Code 了。

我用 OpenClaw 作为编排层。我的编排 Agent Zoe 负责派生子 Agent、编写 prompt、为每个任务选择合适的模型、监控进度,并在 PR 准备好合并时通过 Telegram 通知我。

过去 4 周的数据:

  • 单日 94 次 commit。 我最高产的一天——当天有 3 个客户电话,我一次编辑器都没打开。日均约 50 次 commit。
  • 30 分钟内 7 个 PR。 从想法到生产极快,因为编码和验证基本全自动化。
  • Commits → MRR: 我用这套系统构建真实的 B2B SaaS——配合创始人主导的销售,当天交付大多数功能请求。速度把潜在客户转化成付费用户。

我的 git 历史看起来像刚雇了一个开发团队。实际上只有我一个人——从直接管理 Claude Code,进化到用 OpenClaw Agent 管理一批 Claude Code 和 Codex Agent。

成功率: 系统对几乎所有中小任务一次性完成,无需人工干预。

成本: Claude 约 $100/月 + Codex $90/月,但你可以从 $20 起步。


为什么一个 AI 无法同时做两件事

上下文窗口是零和博弈。你必须选择放什么进去。

塞满代码 → 没有业务上下文的空间。塞满客户历史 → 没有代码库的空间。这就是两层系统有效的原因:每个 AI 只加载它需要的内容。

通过上下文实现专业化,而不是通过不同的模型。


完整的 8 步工作流

第 1 步:客户需求 → 与 Zoe 确定范围

客户电话结束后,我和 Zoe 讨论需求。因为所有会议记录自动同步到我的 Obsidian vault,无需额外解释。然后 Zoe 做三件事:

  • 充值额度,立即解除客户阻塞——她有管理员 API 访问权限
  • 从生产数据库拉取客户配置——只读生产 DB 访问,获取现有设置
  • 派生一个 Codex Agent——附带包含所有上下文的详细 prompt

第 2 步:派生 Agent

每个 Agent 有自己的 worktree(隔离分支)和 tmux session:

# 创建 worktree + 派生 Agent
git worktree add ../feat-custom-templates -b feat/custom-templates origin/main
cd ../feat-custom-templates && pnpm install
tmux new-session -d -s "codex-templates" \
  -c "/path/to/worktrees/feat-custom-templates" \
  "$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex high"

启动 Agent 的命令:

# Codex
codex --model gpt-5.3-codex \
  -c "model_reasoning_effort=high" \
  --dangerously-bypass-approvals-and-sandbox \
  "Your prompt here"

# Claude Code
claude --model claude-opus-4.5 \
  --dangerously-skip-permissions \
  -p "Your prompt here"

用 tmux 的核心优势是任务中途重定向

# 方向错了,直接纠正:
tmux send-keys -t codex-templates "Stop. Focus on the API layer first, not the UI." Enter

# 需要更多上下文:
tmux send-keys -t codex-templates "The schema is in src/types/template.ts. Use that." Enter

任务状态追踪在 .clawdbot/active-tasks.json

{
  "id": "feat-custom-templates",
  "tmuxSession": "codex-templates",
  "agent": "codex",
  "status": "running",
  "notifyOnComplete": true
}

第 3 步:循环监控

每 10 分钟运行一个 cron job,读取 JSON 注册表并检查:

  • tmux session 是否存活
  • 追踪分支上是否有待处理 PR
  • 通过 gh CLI 检查 CI 状态
  • 自动重启失败的 Agent(最多 3 次)
  • 只在需要人工介入时发出告警

我不盯着终端。系统告诉我什么时候该看。

第 4 步:Agent 创建 PR

Agent 提交、推送,并通过 gh pr create --fill 开 PR。完成标准:

  • PR 已创建 + 分支已同步到 main
  • CI 通过(lint、类型检查、单元测试、E2E)
  • Codex review 通过
  • Claude Code review 通过
  • Gemini review 通过
  • 如有 UI 变更,必须包含截图

第 5 步:自动化代码审查

每个 PR 由三个 AI 模型审查:

  • Codex Reviewer — 擅长边界情况、逻辑错误、竞态条件。误报率极低。
  • Gemini Code Assist — 免费,能发现安全问题和可扩展性问题。必装。
  • Claude Code Reviewer — 倾向过度谨慎。除非标记为 critical,否则跳过。

第 6 步:自动化测试

CI 流水线:Lint + TypeScript → 单元测试 → E2E 测试 → 针对预览环境的 Playwright 测试。

新规则:如果 PR 修改了任何 UI,必须包含截图,否则 CI 失败。

第 7 步:人工审查

这时我收到 Telegram 通知:"PR #341 ready for review。"

我的审查只需 5-10 分钟。很多 PR 我不看代码直接合并——截图告诉了我所有需要知道的。

第 8 步:合并

PR 合并。每日 cron job 清理孤立的 worktree 和任务注册表 JSON。


Ralph Loop V2:Agent 失败时怎么办

当 Agent 失败时,Zoe 不会用相同的 prompt 简单重启。她带着完整的业务上下文分析失败原因:

  • Agent 上下文耗尽?"只关注这三个文件。"
  • Agent 方向跑偏?"停。客户要的是 X,不是 Y。"
  • Agent 需要澄清?"这是客户的邮件和他们公司的业务。"

Zoe 还会主动找工作:

  • 早上: 扫描 Sentry → 发现 4 个新错误 → 派生 4 个 Agent 修复
  • 会议后: 扫描会议记录 → 为功能请求派生 Agent
  • 晚上: 扫描 git log → 派生 Claude Code 更新 changelog 和文档

如何选择合适的 Agent

Agent适用场景占比
Codex后端逻辑、复杂 bug、多文件重构90%
Claude Code前端、git 操作,速度更快~8%
Gemini设计感知,先生成 HTML/CSS 规范,再由 Claude Code 实现~2%

如何快速搭建这套系统

把这篇文章完整复制到 OpenClaw,然后说:"为我的代码库实现这套 Agent Swarm 配置。"

它会读取架构、创建脚本、设置目录结构、配置 cron 监控。10 分钟搞定。


意想不到的瓶颈:内存

每个 Agent 需要自己的 worktree + node_modules。我的 16GB Mac Mini 在 4-5 个 Agent 时就开始 swap。我买了一台 128GB 内存的 Mac Studio M4 Max($3,500)来支撑这套系统。

如果你刚起步,4-5 个并发 Agent 已经足够强大。


原文:https://x.com/elvissun/status/2025920521871716562 | 作者:@elvissun | 数据:👍 10,127 | 👁 3,919,563

AD SLOT — BOTTOM
OpenClaw + Codex Agent Swarm:一人开发团队完整搭建指南 — ClaWHow