OpenClaw + Codex Agent Swarm：一人开发团队完整搭建指南

来源：https://x.com/elvissun/status/2025920521871716562 作者：Elvis (@elvissun) 发布时间：2026-02-23 数据：👍 10,127 | 🔁 1,513 | 👁 3,919,563 转载声明：本文转载自 X，原作者 @elvissun，版权归原作者所有。

我不再直接使用 Codex 或 Claude Code 了。

我用 OpenClaw 作为编排层。我的编排 Agent Zoe 负责派生子 Agent、编写 prompt、为每个任务选择合适的模型、监控进度，并在 PR 准备好合并时通过 Telegram 通知我。

过去 4 周的数据：

单日 94 次 commit。 我最高产的一天——当天有 3 个客户电话，我一次编辑器都没打开。日均约 50 次 commit。
30 分钟内 7 个 PR。 从想法到生产极快，因为编码和验证基本全自动化。
Commits → MRR： 我用这套系统构建真实的 B2B SaaS——配合创始人主导的销售，当天交付大多数功能请求。速度把潜在客户转化成付费用户。

使用 OpenClaw 前后对比

我的 git 历史看起来像刚雇了一个开发团队。实际上只有我一个人——从直接管理 Claude Code，进化到用 OpenClaw Agent 管理一批 Claude Code 和 Codex Agent。

成功率： 系统对几乎所有中小任务一次性完成，无需人工干预。

成本： Claude 约 $100/月 + Codex $90/月，但你可以从 $20 起步。

为什么一个 AI 无法同时做两件事

上下文窗口是零和博弈。你必须选择放什么进去。

塞满代码 → 没有业务上下文的空间。塞满客户历史 → 没有代码库的空间。这就是两层系统有效的原因：每个 AI 只加载它需要的内容。

OpenClaw vs Codex 上下文对比

通过上下文实现专业化，而不是通过不同的模型。

完整的 8 步工作流

系统架构总览

第 1 步：客户需求 → 与 Zoe 确定范围

客户电话结束后，我和 Zoe 讨论需求。因为所有会议记录自动同步到我的 Obsidian vault，无需额外解释。然后 Zoe 做三件事：

充值额度，立即解除客户阻塞——她有管理员 API 访问权限
从生产数据库拉取客户配置——只读生产 DB 访问，获取现有设置
派生一个 Codex Agent——附带包含所有上下文的详细 prompt

第 2 步：派生 Agent

每个 Agent 有自己的 worktree（隔离分支）和 tmux session：

git worktree add ../feat-custom-templates -b feat/custom-templates origin/main
cd ../feat-custom-templates && pnpm install
tmux new-session -d -s "codex-templates" \
  -c "/path/to/worktrees/feat-custom-templates" \
  "$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex high"

# Codex
codex --model gpt-5.3-codex \
  -c "model_reasoning_effort=high" \
  --dangerously-bypass-approvals-and-sandbox \
  "Your prompt here"

# Claude Code
claude --model claude-opus-4.5 \
  --dangerously-skip-permissions \
  -p "Your prompt here"

用 tmux 的核心优势是任务中途重定向：

tmux send-keys -t codex-templates "Stop. Focus on the API layer first, not the UI." Enter
tmux send-keys -t codex-templates "The schema is in src/types/template.ts. Use that." Enter

任务状态追踪在 .clawdbot/active-tasks.json：

{
  "id": "feat-custom-templates",
  "tmuxSession": "codex-templates",
  "agent": "codex",
  "status": "running",
  "notifyOnComplete": true
}

第 3 步：循环监控

每 10 分钟运行一个 cron job，读取 JSON 注册表并检查：tmux session 是否存活、是否有待处理 PR、CI 状态、自动重启失败 Agent（最多 3 次）、只在需要人工介入时告警。

我不盯着终端。系统告诉我什么时候该看。

第 4 步：Agent 创建 PR

Agent 提交、推送，并通过 gh pr create --fill 开 PR。完成标准：PR 已创建 + CI 通过 + 三个 AI 审查通过 + 如有 UI 变更必须包含截图。

第 5 步：自动化代码审查

Codex Reviewer — 擅长边界情况、逻辑错误、竞态条件。误报率极低。
Gemini Code Assist — 免费，能发现安全问题和可扩展性问题。必装。
Claude Code Reviewer — 倾向过度谨慎。除非标记为 critical，否则跳过。

第 6 步：自动化测试

CI 流水线：Lint + TypeScript → 单元测试 → E2E 测试 → Playwright 测试。新规则：PR 修改任何 UI 必须包含截图，否则 CI 失败。

第 7 步：人工审查

收到 Telegram 通知："PR #341 ready for review。"

我的审查只需 5-10 分钟。很多 PR 我不看代码直接合并——截图告诉了我所有需要知道的。

第 8 步：合并

PR 合并。每日 cron job 清理孤立的 worktree 和任务注册表 JSON。

Git 提交历史截图

Ralph Loop V2：Agent 失败时怎么办

当 Agent 失败时，Zoe 不会用相同的 prompt 简单重启。她带着完整的业务上下文分析失败原因：

Agent 上下文耗尽？"只关注这三个文件。"
Agent 方向跑偏？"停。客户要的是 X，不是 Y。"
Agent 需要澄清？"这是客户的邮件和他们公司的业务。"

Zoe 还会主动找工作：早上扫描 Sentry 修 bug、会议后扫描记录派发功能任务、晚上更新 changelog 和文档。

如何选择合适的 Agent

Agent	适用场景	占比
Codex	后端逻辑、复杂 bug、多文件重构	90%
Claude Code	前端、git 操作，速度更快	~8%
Gemini	设计感知，先生成 HTML/CSS 规范，再由 Claude Code 实现	~2%

如何快速搭建这套系统

把这篇文章完整复制到 OpenClaw，然后说："为我的代码库实现这套 Agent Swarm 配置。"

它会读取架构、创建脚本、设置目录结构、配置 cron 监控。10 分钟搞定。

意想不到的瓶颈：内存

每个 Agent 需要自己的 worktree + node_modules。16GB Mac Mini 在 4-5 个 Agent 时就开始 swap。我买了一台 128GB 内存的 Mac Studio M4 Max（$3,500）来支撑这套系统。

如果你刚起步，4-5 个并发 Agent 已经足够强大。

原文链接：https://x.com/elvissun/status/2025920521871716562 | 转载自 @elvissun