返回首页
coding2026-02-23

OpenClaw + Codex Agent Swarm:一人开发团队完整搭建指南

作者: Elvis (@elvissun)查看原文
AD SLOT — TOP

来源:https://x.com/elvissun/status/2025920521871716562 作者:Elvis (@elvissun) 发布时间:2026-02-23 数据:👍 10,127 | 🔁 1,513 | 👁 3,919,563 转载声明:本文转载自 X,原作者 @elvissun,版权归原作者所有。


我不再直接使用 Codex 或 Claude Code 了。

我用 OpenClaw 作为编排层。我的编排 Agent Zoe 负责派生子 Agent、编写 prompt、为每个任务选择合适的模型、监控进度,并在 PR 准备好合并时通过 Telegram 通知我。

过去 4 周的数据:

  • 单日 94 次 commit。 我最高产的一天——当天有 3 个客户电话,我一次编辑器都没打开。日均约 50 次 commit。
  • 30 分钟内 7 个 PR。 从想法到生产极快,因为编码和验证基本全自动化。
  • Commits → MRR: 我用这套系统构建真实的 B2B SaaS——配合创始人主导的销售,当天交付大多数功能请求。速度把潜在客户转化成付费用户。

使用 OpenClaw 前后对比

我的 git 历史看起来像刚雇了一个开发团队。实际上只有我一个人——从直接管理 Claude Code,进化到用 OpenClaw Agent 管理一批 Claude Code 和 Codex Agent。

成功率: 系统对几乎所有中小任务一次性完成,无需人工干预。

成本: Claude 约 $100/月 + Codex $90/月,但你可以从 $20 起步。


为什么一个 AI 无法同时做两件事

上下文窗口是零和博弈。你必须选择放什么进去。

塞满代码 → 没有业务上下文的空间。塞满客户历史 → 没有代码库的空间。这就是两层系统有效的原因:每个 AI 只加载它需要的内容。

OpenClaw vs Codex 上下文对比

通过上下文实现专业化,而不是通过不同的模型。


完整的 8 步工作流

系统架构总览

第 1 步:客户需求 → 与 Zoe 确定范围

客户电话结束后,我和 Zoe 讨论需求。因为所有会议记录自动同步到我的 Obsidian vault,无需额外解释。然后 Zoe 做三件事:

  • 充值额度,立即解除客户阻塞——她有管理员 API 访问权限
  • 从生产数据库拉取客户配置——只读生产 DB 访问,获取现有设置
  • 派生一个 Codex Agent——附带包含所有上下文的详细 prompt

第 2 步:派生 Agent

每个 Agent 有自己的 worktree(隔离分支)和 tmux session:

git worktree add ../feat-custom-templates -b feat/custom-templates origin/main
cd ../feat-custom-templates && pnpm install
tmux new-session -d -s "codex-templates" \
  -c "/path/to/worktrees/feat-custom-templates" \
  "$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex high"
# Codex
codex --model gpt-5.3-codex \
  -c "model_reasoning_effort=high" \
  --dangerously-bypass-approvals-and-sandbox \
  "Your prompt here"

# Claude Code
claude --model claude-opus-4.5 \
  --dangerously-skip-permissions \
  -p "Your prompt here"

用 tmux 的核心优势是任务中途重定向

tmux send-keys -t codex-templates "Stop. Focus on the API layer first, not the UI." Enter
tmux send-keys -t codex-templates "The schema is in src/types/template.ts. Use that." Enter

任务状态追踪在 .clawdbot/active-tasks.json

{
  "id": "feat-custom-templates",
  "tmuxSession": "codex-templates",
  "agent": "codex",
  "status": "running",
  "notifyOnComplete": true
}

第 3 步:循环监控

每 10 分钟运行一个 cron job,读取 JSON 注册表并检查:tmux session 是否存活、是否有待处理 PR、CI 状态、自动重启失败 Agent(最多 3 次)、只在需要人工介入时告警。

我不盯着终端。系统告诉我什么时候该看。

第 4 步:Agent 创建 PR

Agent 提交、推送,并通过 gh pr create --fill 开 PR。完成标准:PR 已创建 + CI 通过 + 三个 AI 审查通过 + 如有 UI 变更必须包含截图。

第 5 步:自动化代码审查

  • Codex Reviewer — 擅长边界情况、逻辑错误、竞态条件。误报率极低。
  • Gemini Code Assist — 免费,能发现安全问题和可扩展性问题。必装。
  • Claude Code Reviewer — 倾向过度谨慎。除非标记为 critical,否则跳过。

第 6 步:自动化测试

CI 流水线:Lint + TypeScript → 单元测试 → E2E 测试 → Playwright 测试。新规则:PR 修改任何 UI 必须包含截图,否则 CI 失败。

第 7 步:人工审查

收到 Telegram 通知:"PR #341 ready for review。"

我的审查只需 5-10 分钟。很多 PR 我不看代码直接合并——截图告诉了我所有需要知道的。

第 8 步:合并

PR 合并。每日 cron job 清理孤立的 worktree 和任务注册表 JSON。

Git 提交历史截图


Ralph Loop V2:Agent 失败时怎么办

当 Agent 失败时,Zoe 不会用相同的 prompt 简单重启。她带着完整的业务上下文分析失败原因:

  • Agent 上下文耗尽?"只关注这三个文件。"
  • Agent 方向跑偏?"停。客户要的是 X,不是 Y。"
  • Agent 需要澄清?"这是客户的邮件和他们公司的业务。"

Zoe 还会主动找工作:早上扫描 Sentry 修 bug、会议后扫描记录派发功能任务、晚上更新 changelog 和文档。


如何选择合适的 Agent

Agent适用场景占比
Codex后端逻辑、复杂 bug、多文件重构90%
Claude Code前端、git 操作,速度更快~8%
Gemini设计感知,先生成 HTML/CSS 规范,再由 Claude Code 实现~2%

如何快速搭建这套系统

把这篇文章完整复制到 OpenClaw,然后说:"为我的代码库实现这套 Agent Swarm 配置。"

它会读取架构、创建脚本、设置目录结构、配置 cron 监控。10 分钟搞定。


意想不到的瓶颈:内存

每个 Agent 需要自己的 worktree + node_modules。16GB Mac Mini 在 4-5 个 Agent 时就开始 swap。我买了一台 128GB 内存的 Mac Studio M4 Max($3,500)来支撑这套系统。

如果你刚起步,4-5 个并发 Agent 已经足够强大。


原文链接:https://x.com/elvissun/status/2025920521871716562 | 转载自 @elvissun

AD SLOT — BOTTOM
OpenClaw + Codex Agent Swarm:一人开发团队完整搭建指南 — ClaWHow