← 返回主页 15 个独立示例 5 个组合配方日常最佳实践

AI 编码三剑客实战示例集

15 个真实项目场景 + 5 个组合配方 + 一周/一天的最佳节奏

使用约定

每个示例包含：场景（什么情况下用）→ 命令（具体输入）→ 过程（AI 怎么响应）→ 结果（产出物）→ 关键 Tip
对话框中：绿色 = 你说的话，蓝色 = AI 响应
所有命令均假设你已按前文安装好对应工具

1. gstack 单独使用：5 个示例

gstack 最适合"我要快速 ship 一个产品"的场景，强项在产品视角的需求挑战和工程后段（QA/PR/部署）。

示例 G1 · SaaS 应用加"暗黑模式"

场景：现有 Next.js 项目 · 单人开发 · 半天内 ship

场景

你的 SaaS 应用收到用户反馈"想要暗黑模式"。你想确认这真的是用户痛点，并在半天内上线。

命令链

1. /office-hours      # 挑战需求：是真痛点还是伪需求？
2. /autoplan          # CEO/Design/Eng 三视角联审
3. （Agent 实现代码）
4. /qa https://localhost:3000   # 真实浏览器测试
5. /review            # 自动 lint + 找隐藏 bug
6. /ship              # 跑测试 + 推 PR
7. /land-and-deploy   # 合并 + 部署 + 健康检查

对话片段

You: /office-hours 我想加暗黑模式
AI: 在写代码前我要追问 6 个问题：
　1. 用户具体在什么场景说"想要"？深夜？长时间盯屏？
　2. 你的目标用户群是开发者还是普通办公人？
　3. 你能拿出 3 个用户原话引用吗？
　4. 这事在你的 OKR 里排第几？
　5. 如果不做，会失去多少用户？
　6. 有没有"成本更低 80% 价值"的替代方案？

You: 主要是开发者用户深夜投诉刺眼...
AI: 我推回你的需求定义。你说的不是"暗黑模式"，而是
　"低光环境眼部友好性"。这意味着：
　- 不只是颜色翻转，要降低对比度
　- 优先做代码区域的护眼配色
　- 系统级 prefers-color-scheme 自动跟随足以满足 80% 需求
　建议：先 ship 系统跟随 + 1 个手动开关，2 天内完成。
　不要做：自定义主题、配色编辑器、用户偏好持久化的复杂版。

产出

1 个 MR，包含 ~600 行代码（CSS 变量 + 1 个 toggle 组件）
9 个新增单元测试，2 个 E2E 测试（通过 /qa 自动生成的回归测试）
截图证据：明暗两种模式下的 5 个核心页面
部署后 30 分钟监控数据（/canary 自动跑）

关键 Tip

/office-hours 让你避免做了"用户说要的"而错过"用户真正需要的"。本例中砍掉了 60% 范围（不做主题编辑器），但解决了 90% 痛点。

示例 G2 · 登录页 UI 大改版

场景：转化率优化 · 想要"未来感" · 不知道做成什么样

场景

登录页转化率太低，老板让你"做得更现代一点"。你不知道具体方向，想看几个版本。

命令链

1. /design-shotgun      # AI 一次生成 4-6 个 mock，浏览器对比
2. （选 1-2 个喜欢的，让 AI 二次迭代）
3. /design-html         # 把选中 mock 转成生产级 HTML/CSS
4. /design-review       # 设计师视角检测 AI Slop
5. /qa /login           # 真实浏览器测全流程
6. /benchmark           # 对比改版前后 Core Web Vitals
7. /ship

对话片段

You: /design-shotgun 登录页大改版，要"未来感"但别太花
AI: 已生成 6 个变体，浏览器已打开对比板：
　① 极简白底 + 单一品牌色 hover 动画
　② 渐变玻璃拟态（glassmorphism）
　③ 几何风格背景（受 Linear 启发）
　④ 双栏：左品牌叙事 + 右表单（受 Stripe 启发）
　⑤ 全屏视频背景 + 浮动表单卡片
　⑥ 类终端 CLI 风格（开发者向）
　请选择 1-2 个继续迭代，或留下文字反馈。

You: ④很好但太像 Stripe，⑥ 有意思但担心普通用户看不懂
AI: 学到偏好：双栏布局 OK 但需差异化、CLI 元素可作点缀。
　第 2 轮生成中（基于 ④ 派生 3 个变体）...

产出

~/.gstack/taste/ 下学到的偏好向量（下次自动应用）
shipping.html 生产级 HTML（30KB，零依赖，Pretext 计算布局）
对比 metric：FCP 从 1.8s → 1.2s，转化率监测埋点

关键 Tip

/design-shotgun 的 taste memory 跨项目累积。你做 3 个项目后 AI 就懂你"喜欢留白、讨厌渐变、能接受非对称布局"。

示例 G3 · 生产 Bug 紧急修复

场景：用户报告支付页偶尔卡死 · 半小时内必须有解

场景

客服群里用户报告"支付按钮点了没反应"，发生概率约 5%，无法稳定复现。

命令链

1. /investigate                  # 系统化追根因（铁律：未调查不修）
2. /freeze src/payment           # 锁定 Agent 只能改这个目录
3. /careful                      # 危险命令前警告
4. （Agent 提出 3 个假设并验证）
5. /qa https://staging/checkout  # 复现验证
6. /review                       # 修复合规性审查
7. /ship --hotfix
8. /land-and-deploy --skip-canary --priority urgent

对话片段

You: /investigate 支付按钮 5% 概率点击无响应
AI: 启动调查模式。铁律：未追到根因前不修。
　【追数据流】点击 → handleSubmit → validateForm → API call
　【列假设】
　　H1: validateForm 同步抛错被吞了
　　H2: API 504 但前端无 timeout 处理
　　H3: 双击导致 stripe 重复初始化
　【测试 H1】查 try-catch... ✗ 没问题
　【测试 H2】sentry 看 504 比例... ✗ 0.3% 不匹配 5%
　【测试 H3】查 stripe SDK init 处... ✓ 找到！
　　stripe.elements 在 useEffect 无 deps，每次 re-render
　　被重建，导致 confirm 时引用旧实例 → 静默失败。
　建议：A. 加 useMemo 锁定 elements 实例
　　　 B. 升级 stripe-react SDK 至 v3（自带防护）
　　　 C. 临时禁用双击（治标）
　选 A 最稳。

关键 Tip

火急情况下也千万别跳过 /investigate。它最多花你 5 分钟，但避免你"瞎修"出新 bug 的可能性。3 次失败修复后会自动停止——这就是反"AI 越改越乱"的护栏。

示例 G4 · 新功能从 0 到上线（端到端）

场景：通知系统 · 后端 + 前端 · 1.5 天

场景

产品要做"应用内通知中心"。后端 API + 前端铃铛 + 列表页 + 已读状态。

完整工作流

/office-hours

→

/autoplan

→

实现

→

/qa

→

/review

→

/cso

→

/ship

→

/land-and-deploy

→

/canary

→

/document-release

产出

1 个 PR，~2400 行代码 / 11 文件
新增 9 个单元测试 + 5 个 E2E 测试
OWASP 扫描报告（/cso 输出，0 高危）
README + ARCHITECTURE.md 自动同步
Sentry & Datadog 仪表板监控（/canary 部署后 30 分钟）

关键 Tip

整套流程里 /autoplan 是最值钱的——它一键完成 CEO/设计/工程三视角联审，把决策点打包到一次 AskUserQuestion，省掉手动串联 60% 时间。

示例 G5 · 上线前安全审计

场景：金融 SaaS 第一次正式上线前 · 必须扫一遍

场景

金融工具上线前要做安全审计。预算只够 1 天，不够请第三方。

命令链

/cso                              # OWASP Top 10 + STRIDE 威胁建模
/cso --focus "auth,payment"       # 聚焦认证和支付模块
/freeze .                         # 防止扫描中误改任何文件
/codex --mode adversarial         # 第二意见（GPT 视角对抗审查）

输出片段

AI (CSO mode): 扫描完成。零噪音模式（17 个 FP 排除规则）。

发现 3 个高置信度问题（≥8/10）：

1. SQL Injection · /api/search · 8.5/10
　文件：app/api/search/route.ts:42
　代码：db.query(`SELECT * FROM items WHERE name LIKE '%${q}%'`)
　利用：curl /api/search?q=%';DROP TABLE users;--
　修复：使用 prepared statement

2. Missing rate limit · /api/login · 8/10
　暴力破解风险，建议每 IP 每分钟 5 次

3. XSS · /docs · 9/10
　markdown 渲染未 sanitize，可植入 <script>

关键 Tip

/cso 的零噪音设计很重要——传统扫描器一次给你 200 条，开发者直接关掉。这里只给 8/10 以上 + 附带具体利用代码 + 验证步骤。每条都是真问题。

2. OpenSpec 单独使用：5 个示例

OpenSpec 最适合"我和团队/未来的我需要对齐这次改动"的场景，强在 spec 持久化和文档可追溯。

示例 O1 · 接手 5 年遗留系统的第一个重构

场景：刚入职 · 老板让你重构鉴权模块 · 没人能讲清原有逻辑

场景

你刚入职，要重构 5 年前写的鉴权模块。代码 2000 行，没文档，原作者已离职。

命令链

1. cd legacy-app
2. openspec init                          # 初始化 openspec/ 目录
3. # 编辑 openspec/config.yaml 写明技术栈和约束
4. /opsx:explore "鉴权模块当前是怎样的？"   # AI 先帮你读代码反推 spec
5. /opsx:propose refactor-auth             # 生成 4 件套
6. # 仔细 review proposal/design.md，纠正 AI 的误读
7. /opsx:apply                             # 按 tasks.md 重构
8. /opsx:archive refactor-auth             # 归档进 specs/auth/

对话片段

You: /opsx:explore 鉴权模块当前怎么工作的？
AI: 我已读完 src/auth/ 下 18 个文件。当前实现：
　- Cookie 名 'sid'，HMAC 签名（密钥在 env.SESSION_SECRET）
　- 中间件 authMiddleware 在 4 个 entry point 装载
　- 但 src/legacy/admin.ts 直接 query session 表绕过中间件 ⚠️
　- redis session store + 本地 fallback（旧版兼容）
　发现 3 个隐藏行为：
　　1. 邮箱大小写敏感（与新 spec 不符）
　　2. session 永不主动失效，只靠 30 天 ttl
　　3. 有一个未使用的 oauth_state 表
　这些应在重构前与你确认是 bug 还是有意为之。

产出

openspec/specs/auth/ 包含完整鉴权规范（重构后的目标态）
openspec/changes/archive/2026-05-XX-refactor-auth/ 完整变更历史
新代码 + 1 个 migration script（兼容旧 cookie 格式）

关键 Tip

OpenSpec 在 brownfield 的真正威力：它把"反向工程现有代码"变成了 spec。半年后你或同事再读这个 specs/auth/，能秒懂"这个项目的鉴权约定是什么"。

示例 O2 · 后端 API 接口先定义后实现

场景：后端给前端提供新 API · 双方需要先对齐 contract

场景

前端组催你提供"用户消息批量已读"接口。你想先把 contract 敲定，避免后期反复改。

命令链

/opsx:propose api-mark-messages-read

# 生成的 specs/messages/spec.md 中明确：
# - 请求方法 POST /api/messages/read
# - 请求体 { ids: string[] }（max 100）
# - 响应 200 { updated: number }
# - 401 未登录、403 无权限他人消息、422 参数错误
# - 幂等性：重复调用不报错
# - 边界：ids 为空返回 200 updated:0

# 把 spec 链接发给前端
# 前端 OK 后再
/opsx:apply

关键 Tip

API 设计阶段就把 spec commit 到 repo，前端能在 repo 里看到、commit 历史里看到、CI 中可校验（如果你接 OpenAPI/JSON Schema）。比 Figma/飞书文档"漂浮"在外面强多了。

示例 O3 · 多人协作开发同一功能

场景：3 个工程师 + 1 个产品 · 一周内做完支付重构

场景

3 人小队要做支付重构。每人负责一块，但需要保持 API 和数据约定一致。

命令链

# 切换到 expanded profile（多人协作模式）
openspec config profile expanded
openspec update

# 产品负责人先开 propose
/opsx:propose payment-v2

# review proposal/design 之后 commit + push
git add openspec/changes/payment-v2 && git commit && git push

# 工程师 A：
/opsx:new sub-task-1-stripe-integration

# 工程师 B（在 A 完成 sub-task-1 后）：
/opsx:continue   # 检查 tasks.md 进度，接着做 sub-task-2

# 工程师 C：
/opsx:ff sub-task-3-refunds  # 快进到自己负责的部分

# 周末整体验收：
/opsx:verify     # 跨 sub-task 一致性校验
/opsx:bulk-archive   # 全部归档

关键 Tip

expanded profile 是 OpenSpec 的隐藏强力技能，专为多人协作设计。/opsx:continue 让接手者无需读你的 chat 记录就能精确知道做到哪了。

示例 O4 · 合规变更追溯（金融/医疗场景）

场景：每个变更都要可审计 · 半年后被审计员问起怎么办

场景

金融行业项目，每个变更都需要"为什么改、谁批准、改了什么"的完整追溯。审计员可能 6 个月后来抽查。

命令链

# 在 openspec/config.yaml 强制规则
rules:
  proposal:
    - 必须包含 "Compliance Impact" 章节
    - 必须列出 affected regulations (SOX, PCI-DSS 等)
    - 必须有 reviewer 签字字段
  archive:
    - 归档时附带 audit trail (谁 review、何时 approve)

# 每个变更：
/opsx:propose update-transaction-limits
# proposal 自动包含合规章节
# CISO 在 proposal.md 中签字注明 approved
git commit  # 留下 git history
/opsx:apply
/opsx:archive  # 归档，永久保留

关键 Tip

审计员 6 个月后问"为什么 5 月 12 号改了交易限额？"——你打开 openspec/changes/archive/2026-05-12-update-transaction-limits/，proposal/design/tasks 一目了然，谁批准、什么风险评估都在。这是其他工具完全做不到的。

示例 O5 · 大规模迁移（数据库 / 框架升级）

场景：MySQL 5.7 → PostgreSQL 16 · 涉及 50+ 文件

场景

要把 MySQL 5.7 迁到 PostgreSQL 16。改动会涉及 50+ 文件，可能跨越几周。

命令链

# 总 proposal
/opsx:propose migrate-mysql-to-postgres

# 拆 5 个 sub-changes
/opsx:propose migrate-step-1-schema-translation
/opsx:propose migrate-step-2-orm-update
/opsx:propose migrate-step-3-query-rewrite
/opsx:propose migrate-step-4-data-migration
/opsx:propose migrate-step-5-cleanup-mysql

# 每个 step 独立可逆，独立 ship
# 第 1 step:
/opsx:apply migrate-step-1-schema-translation
# 测试通过后归档，但保留总 proposal
/opsx:archive migrate-step-1-schema-translation

关键 Tip

大型迁移最怕"做到一半被打断"。OpenSpec 的子提案让每一步都独立成 PR、独立可回滚。即使停 2 周再继续，也能精确回到原点。

3. Superpowers 单独使用：5 个示例

Superpowers 最适合"让 AI 自己干，你休息"的场景。它的 subagent + plan + TDD 链能实现长时无人值守。

示例 S1 · 夜间长时执行：写一个完整 CLI 工具

场景：晚上睡前布置任务 · 早上起来看结果

场景

你要写一个跨平台 CLI 工具：参数解析 + 子命令 + 配置文件 + 彩色输出 + 单元测试。

命令链

You: 我想做一个叫 myctl 的命令行工具，需要支持
     init/add/remove/list 4 个子命令，配置文件读 ~/.myctl.yaml
     用 TypeScript + Bun 写

# 自动触发顺序（你不用手动 /xxx）：
1. brainstorming           — 问 6 个问题挑战需求
2. writing-plans           — 拆成 14 个 2-5 分钟的 task
3. （你说 "go" 后）
4. using-git-worktrees     — 创建 isolated worktree
5. subagent-driven-development — 每个 task 派一个新 subagent
6. test-driven-development — 每个 task 强制先写 test
7. requesting-code-review  — 任务间自动 review
8. finishing-a-development-branch — 完成后选 merge / PR

实战日志（节选）

[22:30] brainstorming: 14 个澄清问题完成
[22:35] writing-plans: 14 个 task 计划已写入 plan.md
[22:36] You: go
[22:36] git worktree add ../myctl-feat feature/init
[22:37] Subagent-1: task-1 (init 子命令)
        TDD RED: 写测试 init creates ~/.myctl.yaml ... ✗ FAIL
        TDD GREEN: 实现 src/commands/init.ts ... ✓ PASS
        review: 通过
[22:42] Subagent-2: task-2 (add 子命令)
[...每个 subagent 4-6 分钟...]
[01:18] task-13 完成
[01:24] task-14 完成（文档）
[01:25] finishing-branch: 测试 47 个全过，提示是否 PR
[早上 8 点]
You: 看见 plan 100% 完成，发个 PR 吧
AI: 已开 PR #42，等你 review

关键 Tip

这是 Superpowers 的核心红利。其它工具的 Agent 主流程是"边写边问"，1 小时后会偏离原计划。Superpowers 的 subagent 每个跑完即退出，主 Agent 只负责调度，不会被污染上下文。

示例 S2 · 复杂 Bug 系统化调试

场景：偶发 race condition · 重启就好 · 一天复现 1 次

场景

测试同事报"系统偶尔会显示空白页面"，每天发生 1-3 次，重启服务就好。你怀疑 race condition 但找不到。

触发的 skill

You: 帮我修这个偶发空白页 bug
     测试日志在 logs/2026-05-15-bug.log

自动触发：
1. systematic-debugging   — 4 阶段方法论
2. （reproduce 阶段）condition-based-waiting 找出触发条件
3. （isolate 阶段）root-cause-tracing 反向追踪数据流
4. （fix 阶段）defense-in-depth 多层防御
5. verification-before-completion — 必须证明已修

对话片段

AI: 启用 systematic-debugging。
阶段 1: REPRODUCE
　日志中 21 次空白页都发生在 60s 内有 ≥3 个并发请求时。
　已写脚本 stress-test.ts 模拟，本地 100% 复现。

阶段 2: ISOLATE
　root-cause-tracing：用户请求 → SSR → 数据 fetch...
　发现：getServerSideProps 中的 globalCache 是
　模块级变量，第二个请求覆盖了第一个的 ctx。

阶段 3: FIX
　defense-in-depth：三层防御
　　L1: globalCache 改为 per-request scope
　　L2: 加 invariant 断言不允许跨请求复用
　　L3: 加 telemetry 监控异常情况

阶段 4: VERIFY
　verification-before-completion：
　- 跑 stress-test 1000 次，0 个失败 ✓
　- 单元测试覆盖了 race 场景 ✓
　- 部署 staging 监控 30 分钟 ✓
　已确认修复（不仅"我觉得修了"）。

关键 Tip

systematic-debugging 的 4 阶段顺序不可跳跃。新手最爱直接跳到 FIX，结果"修了一处坏了三处"。这个 skill 强制你必须先复现、再隔离、再修。

示例 S3 · 重构遗留代码（强制 TDD）

场景：把 800 行的 god function 拆成模块 · 不能改行为

场景

有个 800 行的 calculatePricing 函数，已经多次改坏过。你想拆成 5 个小函数，但不能改任何行为。

关键技巧：先 characterization tests

You: 重构 calculatePricing，要求行为完全不变

自动触发：
1. test-driven-development
   先生成 characterization tests（覆盖现有所有行为）
   测试必须 100% 通过 = 拿到"不变量"
2. writing-plans
   拆成 5 个 refactor task
3. subagent-driven-development
   每个 subagent 拆一块，跑特征测试，不通过则回滚

对话片段

AI: 启用 TDD 模式重构。
第 0 步：写 32 个 characterization tests 覆盖现有行为
　- 7 个边界（0、负数、null、empty）
　- 12 个折扣组合
　- 8 个货币转换
　- 5 个 promo code
　全部 PASS ✓ —— 现在我有"行为快照"

Refactor 1: 抽 calculateBasePrice
　跑 32 个 test... 32/32 PASS
Refactor 2: 抽 applyDiscounts
　跑 32 个 test... 31/32 PASS ⚠️
　回滚！触发 verification-before-completion
　发现：promo "VIP" 的折扣顺序变了
　修复后再跑... 32/32 PASS ✓

关键 Tip

TDD 在重构里是救命稻草。先把现有行为冻结成测试，重构每一步都验证不变。这是手工重构很难做到的纪律。

示例 S4 · 并行多任务（5 个独立 feature）

场景：sprint 后期 · 5 个小 feature 互不依赖 · 想并行

场景

sprint 还剩 5 个小 feature：邮件模板、导出 CSV、深色 favicon、404 页、健康检查端点。彼此独立。

命令链

You: 并行做这 5 个 feature
     [feature 1-5 描述]

自动触发：
1. dispatching-parallel-agents
   - 检测 5 个任务无依赖
   - 用 git worktree 创建 5 个分支
   - 派 5 个 subagent 并行执行
2. 每个 subagent 内部走 brainstorming → writing-plans → TDD
3. 完成后主 Agent 汇总结果，5 个分支独立 PR

实测 ROI

串行执行预估 6 小时，并行 4 个 subagent + 主 Agent 汇总：1.8 小时完成。Token 用量增加 4.5 倍但时间省 3.3 倍。

关键 Tip

使用前确认任务真的独立。如果 task 2 依赖 task 1 的某个 util 函数，并行会失败。Superpowers 会先做依赖检测，但有时检测不出语义层耦合。

示例 S5 · 实现新算法（纯 TDD）

场景：写一个文本相似度算法 · 学术正确性优先

场景

要实现 Levenshtein 距离 + 余弦相似度 + Jaro-Winkler 三种算法，用于文档去重。学术正确性优先。

流程

You: 实现 3 种文本相似度算法，用 TDD

# Superpowers 强制 TDD 流程：
# 对每个算法都跑 RED-GREEN-REFACTOR：

[RED]
- 写测试：levenshtein("kitten", "sitting") === 3
- 跑测试 → ✗ FAIL（函数还不存在）

[GREEN]
- 写最少代码让测试通过（即使是 hardcoded）
- 跑测试 → ✓ PASS

[REFACTOR]
- 把硬编码改成真正的 DP 算法
- 加更多测试用例
- 跑测试 → ✓ PASS

# 三个算法 × 3 个循环 = 9 步骤

对话片段

You: 我已经写了 levenshtein 实现，跳过 RED 阶段直接测试
AI: ❌ 检测到违反 TDD 顺序。
　test-driven-development skill 规定：
　"Deletes code written before tests."
　已删除你的 src/levenshtein.ts。请：
　1. 先写测试用例（建议参考维基百科测试集）
　2. 跑测试看到 RED
　3. 再写实现达到 GREEN

关键 Tip

算法实现是 TDD 最有价值的领域之一——测试用例就是算法的形式化定义。Superpowers 的硬性 TDD 在这种场景下是优势而非负担。

4. 任意组合使用：5 个示例

三个工具互不冲突，可以叠加使用。下面 5 个组合涵盖最常见的真实开发场景。

示例 C1 · 三件套黄金配方：全栈新功能

场景：2-5 人小团队 · 做一个长期维护的核心功能

场景

给 SaaS 加"团队协作工作区"功能。需要：API 设计、UI 设计、可审计文档、代码质量、线上稳定。

完整流程图

/office-hours
挑战需求

→

/opsx:propose
产生 spec 4 件套

→

/plan-design-review
设计师视角

→

writing-plans
SP 拆细 task

→

subagent-dev
SP 长时执行

→

TDD
SP 强制测试

→

/qa
真浏览器

→

/review + /cso
代码 + 安全

→

/ship + /land
发布

→

/opsx:archive
spec 归档

对话片段

You: 给 SaaS 加 workspace 协作功能
AI: 启动黄金三件套流程。

第 1 阶段 (gstack)：/office-hours
　6 个挑战问题... [省略] 共识：先做"项目级共享"，
　不做"用户级权限矩阵"（v2 再说）。

第 2 阶段 (OpenSpec)：/opsx:propose workspace-v1
　已生成：
　- proposal.md（why + what + non-goals）
　- specs/workspace/spec.md（API contract + 数据模型）
　- design.md（5 个 ASCII 架构图）
　- tasks.md（21 个 task）

第 3 阶段 (Superpowers)：自动检测到 plan，
　writing-plans 把 21 个 task 进一步拆到每个 ≤5 分钟
　subagent-driven-development 调度 21 个独立 subagent
　TDD 强制每个 task 先写 test
　[3 小时后] 21/21 完成

第 4 阶段 (gstack)：
　/qa: 5 个用户 flow 全过
　/review: 自动修 3 处，标记 1 处需你拍板
　/cso: 0 高危
　/ship: PR #87 已开
　/land-and-deploy: 部署成功

第 5 阶段 (OpenSpec)：/opsx:archive workspace-v1
　spec 永久归入 openspec/specs/workspace/

最终产出（"对齐三方"）

给谁看的	产物
团队 / 产品经理	OpenSpec 的 proposal.md + specs/
未来的你 / 同事	archive 历史 + git log
线上用户	已部署的功能 + Sentry 监控
审计 / 合规	specs/ 全量可追溯
设计师	/design-review 的视觉打分报告

关键 Tip

这是生产项目最强组合。每个工具发挥自己的强项，互不重复：
① gstack 管"做对的产品"
② OpenSpec 管"对齐到 spec"
③ Superpowers 管"把代码做对"

示例 C2 · OpenSpec + Superpowers：合规项目

场景：金融/医疗 · 没有用户 UI · 后端 + 数据 pipeline

场景

纯后端服务（消息队列、数据 pipeline、定时任务）。要审计追溯、要 TDD，但用不到浏览器 QA 和产品挑战。

命令链

# 1. OpenSpec 设计 spec（合规审计）
/opsx:propose pipeline-v2-data-encryption

# 2. CISO review proposal/design.md，签字
git commit -m "approved by CISO 2026-05-20"

# 3. Superpowers 拆 task + TDD 实现
You: 按 tasks.md 实现

[自动激活]
- writing-plans 把 OpenSpec tasks.md 进一步拆细
- subagent-driven-development 长时执行
- test-driven-development 每个 task 强制 TDD
- verification-before-completion 验证

# 4. 不需要 gstack（无 UI）
# 5. 归档
/opsx:archive pipeline-v2-data-encryption

关键 Tip

C2 配方省掉 gstack是合理的——纯后端服务没有视觉、没有浏览器流，gstack 的 /qa /design-* 都用不上。但如果你的后端服务对外暴露了 admin UI 或 metric dashboard，那还是建议加上 gstack。

示例 C3 · gstack + Superpowers：单人创业开发

场景：独立开发者 · 个人项目 · 不需要复杂文档

场景

你一个人做一个小工具或独立项目。需要快速 ship，需要纪律但不需要团队对齐文档。

命令链

# 1. 需求挑战（gstack）
/office-hours

# 2. 计划 + 实现（Superpowers）
[自动触发 brainstorming → writing-plans → 
 subagent-driven-development → TDD]

# 3. QA + 发布（gstack）
/qa https://staging
/review
/ship
/land-and-deploy

# 4. 复盘（gstack）
/retro

为什么不用 OpenSpec

个人项目里 OpenSpec 的 ROI 偏低：你自己脑子里清楚为什么改、改了什么。spec 文档只是给"未来的你"看，但小项目通常活不到那时候。

关键 Tip

这是独立开发者最佳组合。简洁、快速、有质量保证。如果项目从 PoC 变成认真做的产品，再加上 OpenSpec。

示例 C4 · OpenSpec + gstack：内部工具/管理后台

场景：公司内部工具 · 几个人用 · 改动需文档化但不需要 TDD 强约束

场景

给运营做的报表后台。功能简单（CRUD + 图表），但每次改动要让其他运营知情，部署要稳定。

命令链

# 1. spec 文档（OpenSpec）让运营了解
/opsx:propose add-monthly-report-export

# 2. 直接让 Agent 实现（不强制 TDD，运营工具改动太频繁）
You: 按 tasks.md 实现，写关键单元测试就行

# 3. UI 用 gstack 改进
/design-shotgun
/design-html

# 4. 测试 + 发布
/qa
/review
/ship
/opsx:archive

关键 Tip

内部工具的改动节奏快、需求漂移大。跳过 Superpowers 的 TDD 强制是合理选择——每次都强制 RED-GREEN-REFACTOR 反而拖慢进度。但 spec（让运营了解）和 QA（避免线上卡死）不能省。

示例 C5 · 三件套救火：生产事故响应

场景：线上重大事故 · 1 小时内必须有解 · 但不能再出问题

场景

支付服务挂了 30 分钟，已恢复但根因不明。要在 1 小时内做出 hotfix，且必须有完整事故记录给老板和合规。

分秒级命令链

# T+0:00  事故发生 → 已快速回滚

# T+5:00  开 incident spec（OpenSpec）
/opsx:propose incident-2026-05-20-payment-outage

# T+10:00 系统化调查（gstack）
/investigate
[8 分钟后定位到 redis 连接池耗尽]

# T+25:00 Superpowers TDD 实现修复
You: 按 investigate 输出实现 hotfix
[Superpowers: 先写复现 race 的测试 → 修复 → 验证]

# T+45:00 安全审查（gstack）
/review --hotfix
/cso --focus "auth,payment"

# T+50:00 发布
/ship --hotfix
/land-and-deploy --priority urgent

# T+58:00 监控
/canary --duration 30m

# T+次日   归档
/opsx:archive incident-2026-05-20-payment-outage
# 含 RCA、timeline、修复细节、防御措施

事故 spec 包含

Timeline: 每分钟事件（来自 git commits + monitoring）
Root Cause: /investigate 输出
Fix: 实际改动（含 TDD 写的测试）
Verification: /qa /canary 截图 + 监控数据
Prevention: 防止再次发生的措施

关键 Tip

事故响应中"快"和"稳"必须同时——三件套刚好对应这两个维度：gstack 给你快速调查 + 部署，Superpowers 给你 TDD 验证防止"修出新 bug"，OpenSpec 给你完整事故记录。

5. 日常开发最佳实践

5.1 一周节奏

把三个工具放进一周开发节奏里：

周一上午 · Sprint 启动

gstack /office-hours × 每个新需求一次（≤30 分钟）
OpenSpec /opsx:propose × 每个改动写 spec（spec review 在午饭前完成）
下班前：gstack /autoplan 跑一遍多视角联审

周二-周四 · 实现期

Superpowers 的 brainstorming + writing-plans + subagent 自动驱动
每天早上确认 plan 进度（多数情况 60-80% 自动完成）
每个 task 完成自动 Superpowers requesting-code-review
写 git commit message 时遵循 conventional commits

周五上午 · 测试 + 发布

gstack /qa × 每个新页面 / 流程
gstack /review + /cso
gstack /ship + /land-and-deploy

周五下午 · 复盘

gstack /retro 看本周 ship 节奏
OpenSpec /opsx:archive 把已完成变更归档
gstack /learn 把本周新踩的坑写进项目记忆

5.2 一天的节奏（90 分钟番茄钟单元）

单元 1 · 09:00-10:30 思考期

新需求触发 /office-hours，挑战 6 问
清晰后 /opsx:propose 生成 spec
看 design.md，纠正 AI 误读
不要写代码，思考期专注思考

单元 2 · 10:45-12:15 启动期

给 Agent 说 "go"，Superpowers 自动激活 plan + subagent
你做监督：每 15 分钟看一眼 plan 进度
不要打断 subagent，让它跑完 task 再插话

单元 3 · 14:00-15:30 推进期

大部分自动跑，你做并行其他事
Agent 偶尔会 AskUserQuestion，及时回答
避免开新需求打断主流程

单元 4 · 15:45-17:15 收尾期

/qa 跑用户流测试
/review 找隐藏 bug
/ship 推 PR
把 PR 链接发同事 review

下班前 5 分钟

/learn 把今天踩的坑记下
检查所有 worktree（Superpowers 有时会留）：git worktree list
如有未合并 hotfix，明早第一件事处理

5.3 10 条铁律（来自实战）

1需求挑战永远不省

无论用哪个工具，第一步永远是挑战需求（/office-hours / brainstorming / /opsx:explore）。这是最高 ROI 的 5 分钟。

2spec 一定要 commit

OpenSpec 的 changes/ 和 specs/ 必须 commit 到 repo。本地 spec 等于没有 spec。

3子 Agent 不要打断

Superpowers 派出的 subagent 在跑时不要插话。要等它完成或失败后再介入。打断会污染上下文，让后续 task 偏离。

4测试覆盖双层

下层用 Superpowers TDD（unit/integration），上层用 gstack /qa（E2E/visual）。两者不可替代。

5review 是必经关卡

所有合并前必须 /review。它会找 CI 通过但生产爆炸的隐藏问题。

6生产事故走完整流程

哪怕"明显是某个原因"也要走 /investigate。3 次失败修复护栏会救你。

7worktree 谁开谁关

Superpowers 的 git worktree 用完要 finishing-a-development-branch 收尾，否则一周后你会发现有 8 个孤儿分支。

8archive 是知识沉淀

每个 OpenSpec change 必须 archive。半年后回看，就是项目的设计史。

9用户指令优先级最高

三个工具都尊重 CLAUDE.md/AGENTS.md。在项目根写明你的偏好（如"PoC 阶段不要 TDD"），所有 skill 都会让步。

10每周 retro 一次

/retro global 跨工具看本周 ship 节奏。这是优化工作流的反馈回路。

5.4 速查 Checklist

开新功能前 ✅

检查项	工具	命令
需求是否真挑战过	gstack	`/office-hours`
spec 是否对齐	OpenSpec	`/opsx:propose`
设计是否过 review	gstack	`/plan-design-review`
架构是否过 review	gstack	`/plan-eng-review`

实现中 ⚙️

检查项	工具	命令/Skill
是否在 worktree 隔离	Superpowers	using-git-worktrees
plan 是否拆到 ≤5 分钟/task	Superpowers	writing-plans
是否先写 test	Superpowers	test-driven-development
edit 范围是否锁定	gstack	`/freeze`

合并前 🚀

检查项	工具	命令
真实浏览器测过	gstack	`/qa <url>`
review 跑过	gstack	`/review`
安全扫描	gstack	`/cso`
验证完成	Superpowers	verification-before-completion
spec 已 archive	OpenSpec	`/opsx:archive`
文档同步	gstack	`/document-release`

每周 📊

检查项	工具	命令
retro 复盘	gstack	`/retro global`
升级 gstack	gstack	`/gstack-upgrade`
升级 OpenSpec	OpenSpec	`npm i -g @fission-ai/openspec@latest && openspec update`
升级 Superpowers	Superpowers	各 host 自动 / 手动重装
清理孤儿 worktree	Git	`git worktree prune`

✅ 终极简化：3 句话记住怎么用

不知道做什么 → 先 /office-hours，再 /opsx:propose
知道做什么了 → Superpowers 自己动起来，TDD + subagent
要 ship 了 → /qa /review /ship /land-and-deploy 一条龙