← 返回主页 15 个独立示例 5 个组合配方 日常最佳实践

AI 编码三剑客实战示例集

15 个真实项目场景 + 5 个组合配方 + 一周/一天的最佳节奏

使用约定
  • 每个示例包含:场景(什么情况下用)→ 命令(具体输入)→ 过程(AI 怎么响应)→ 结果(产出物)→ 关键 Tip
  • 对话框中:绿色 = 你说的话,蓝色 = AI 响应
  • 所有命令均假设你已按前文安装好对应工具

1. gstack 单独使用:5 个示例

gstack 最适合"我要快速 ship 一个产品"的场景,强项在产品视角的需求挑战和工程后段(QA/PR/部署)。

示例 G1 · SaaS 应用加"暗黑模式"
场景:现有 Next.js 项目 · 单人开发 · 半天内 ship
场景

你的 SaaS 应用收到用户反馈"想要暗黑模式"。你想确认这真的是用户痛点,并在半天内上线。

命令链
1. /office-hours      # 挑战需求:是真痛点还是伪需求?
2. /autoplan          # CEO/Design/Eng 三视角联审
3. (Agent 实现代码)
4. /qa https://localhost:3000   # 真实浏览器测试
5. /review            # 自动 lint + 找隐藏 bug
6. /ship              # 跑测试 + 推 PR
7. /land-and-deploy   # 合并 + 部署 + 健康检查
对话片段
You: /office-hours 我想加暗黑模式
AI: 在写代码前我要追问 6 个问题:
 1. 用户具体在什么场景说"想要"?深夜?长时间盯屏?
 2. 你的目标用户群是开发者还是普通办公人?
 3. 你能拿出 3 个用户原话引用吗?
 4. 这事在你的 OKR 里排第几?
 5. 如果不做,会失去多少用户?
 6. 有没有"成本更低 80% 价值"的替代方案?

You: 主要是开发者用户深夜投诉刺眼...
AI: 我推回你的需求定义。你说的不是"暗黑模式",而是
 "低光环境眼部友好性"。这意味着:
 - 不只是颜色翻转,要降低对比度
 - 优先做代码区域的护眼配色
 - 系统级 prefers-color-scheme 自动跟随足以满足 80% 需求
 建议:先 ship 系统跟随 + 1 个手动开关,2 天内完成。
 不要做:自定义主题、配色编辑器、用户偏好持久化的复杂版。
产出
  • 1 个 MR,包含 ~600 行代码(CSS 变量 + 1 个 toggle 组件)
  • 9 个新增单元测试,2 个 E2E 测试(通过 /qa 自动生成的回归测试)
  • 截图证据:明暗两种模式下的 5 个核心页面
  • 部署后 30 分钟监控数据(/canary 自动跑)
关键 Tip

/office-hours 让你避免做了"用户说要的"而错过"用户真正需要的"。本例中砍掉了 60% 范围(不做主题编辑器),但解决了 90% 痛点。

示例 G2 · 登录页 UI 大改版
场景:转化率优化 · 想要"未来感" · 不知道做成什么样
场景

登录页转化率太低,老板让你"做得更现代一点"。你不知道具体方向,想看几个版本。

命令链
1. /design-shotgun      # AI 一次生成 4-6 个 mock,浏览器对比
2. (选 1-2 个喜欢的,让 AI 二次迭代)
3. /design-html         # 把选中 mock 转成生产级 HTML/CSS
4. /design-review       # 设计师视角检测 AI Slop
5. /qa /login           # 真实浏览器测全流程
6. /benchmark           # 对比改版前后 Core Web Vitals
7. /ship
对话片段
You: /design-shotgun 登录页大改版,要"未来感"但别太花
AI: 已生成 6 个变体,浏览器已打开对比板:
 ① 极简白底 + 单一品牌色 hover 动画
 ② 渐变玻璃拟态(glassmorphism)
 ③ 几何风格背景(受 Linear 启发)
 ④ 双栏:左品牌叙事 + 右表单(受 Stripe 启发)
 ⑤ 全屏视频背景 + 浮动表单卡片
 ⑥ 类终端 CLI 风格(开发者向)
 请选择 1-2 个继续迭代,或留下文字反馈。

You: ④很好但太像 Stripe,⑥ 有意思但担心普通用户看不懂
AI: 学到偏好:双栏布局 OK 但需差异化、CLI 元素可作点缀。
 第 2 轮生成中(基于 ④ 派生 3 个变体)...
产出
  • ~/.gstack/taste/ 下学到的偏好向量(下次自动应用)
  • shipping.html 生产级 HTML(30KB,零依赖,Pretext 计算布局)
  • 对比 metric:FCP 从 1.8s → 1.2s,转化率监测埋点
关键 Tip

/design-shotgun 的 taste memory 跨项目累积。你做 3 个项目后 AI 就懂你"喜欢留白、讨厌渐变、能接受非对称布局"。

示例 G3 · 生产 Bug 紧急修复
场景:用户报告支付页偶尔卡死 · 半小时内必须有解
场景

客服群里用户报告"支付按钮点了没反应",发生概率约 5%,无法稳定复现。

命令链
1. /investigate                  # 系统化追根因(铁律:未调查不修)
2. /freeze src/payment           # 锁定 Agent 只能改这个目录
3. /careful                      # 危险命令前警告
4. (Agent 提出 3 个假设并验证)
5. /qa https://staging/checkout  # 复现验证
6. /review                       # 修复合规性审查
7. /ship --hotfix
8. /land-and-deploy --skip-canary --priority urgent
对话片段
You: /investigate 支付按钮 5% 概率点击无响应
AI: 启动调查模式。铁律:未追到根因前不修。
 【追数据流】点击 → handleSubmit → validateForm → API call
 【列假设】
  H1: validateForm 同步抛错被吞了
  H2: API 504 但前端无 timeout 处理
  H3: 双击导致 stripe 重复初始化
 【测试 H1】查 try-catch... ✗ 没问题
 【测试 H2】sentry 看 504 比例... ✗ 0.3% 不匹配 5%
 【测试 H3】查 stripe SDK init 处... ✓ 找到!
  stripe.elements 在 useEffect 无 deps,每次 re-render
  被重建,导致 confirm 时引用旧实例 → 静默失败。
 建议:A. 加 useMemo 锁定 elements 实例
    B. 升级 stripe-react SDK 至 v3(自带防护)
    C. 临时禁用双击(治标)
 选 A 最稳。
关键 Tip

火急情况下也千万别跳过 /investigate。它最多花你 5 分钟,但避免你"瞎修"出新 bug 的可能性。3 次失败修复后会自动停止——这就是反"AI 越改越乱"的护栏。

示例 G4 · 新功能从 0 到上线(端到端)
场景:通知系统 · 后端 + 前端 · 1.5 天
场景

产品要做"应用内通知中心"。后端 API + 前端铃铛 + 列表页 + 已读状态。

完整工作流
/office-hours
/autoplan
实现
/qa
/review
/cso
/ship
/land-and-deploy
/canary
/document-release
产出
  • 1 个 PR,~2400 行代码 / 11 文件
  • 新增 9 个单元测试 + 5 个 E2E 测试
  • OWASP 扫描报告(/cso 输出,0 高危)
  • README + ARCHITECTURE.md 自动同步
  • Sentry & Datadog 仪表板监控(/canary 部署后 30 分钟)
关键 Tip

整套流程里 /autoplan 是最值钱的——它一键完成 CEO/设计/工程三视角联审,把决策点打包到一次 AskUserQuestion,省掉手动串联 60% 时间。

示例 G5 · 上线前安全审计
场景:金融 SaaS 第一次正式上线前 · 必须扫一遍
场景

金融工具上线前要做安全审计。预算只够 1 天,不够请第三方。

命令链
/cso                              # OWASP Top 10 + STRIDE 威胁建模
/cso --focus "auth,payment"       # 聚焦认证和支付模块
/freeze .                         # 防止扫描中误改任何文件
/codex --mode adversarial         # 第二意见(GPT 视角对抗审查)
输出片段
AI (CSO mode): 扫描完成。零噪音模式(17 个 FP 排除规则)。

发现 3 个高置信度问题(≥8/10):

1. SQL Injection · /api/search · 8.5/10
 文件:app/api/search/route.ts:42
 代码:db.query(`SELECT * FROM items WHERE name LIKE '%${q}%'`)
 利用:curl /api/search?q=%';DROP TABLE users;--
 修复:使用 prepared statement

2. Missing rate limit · /api/login · 8/10
 暴力破解风险,建议每 IP 每分钟 5 次

3. XSS · /docs · 9/10
 markdown 渲染未 sanitize,可植入 <script>
关键 Tip

/cso 的零噪音设计很重要——传统扫描器一次给你 200 条,开发者直接关掉。这里只给 8/10 以上 + 附带具体利用代码 + 验证步骤。每条都是真问题

2. OpenSpec 单独使用:5 个示例

OpenSpec 最适合"我和团队/未来的我需要对齐这次改动"的场景,强在 spec 持久化和文档可追溯。

示例 O1 · 接手 5 年遗留系统的第一个重构
场景:刚入职 · 老板让你重构鉴权模块 · 没人能讲清原有逻辑
场景

你刚入职,要重构 5 年前写的鉴权模块。代码 2000 行,没文档,原作者已离职。

命令链
1. cd legacy-app
2. openspec init                          # 初始化 openspec/ 目录
3. # 编辑 openspec/config.yaml 写明技术栈和约束
4. /opsx:explore "鉴权模块当前是怎样的?"   # AI 先帮你读代码反推 spec
5. /opsx:propose refactor-auth             # 生成 4 件套
6. # 仔细 review proposal/design.md,纠正 AI 的误读
7. /opsx:apply                             # 按 tasks.md 重构
8. /opsx:archive refactor-auth             # 归档进 specs/auth/
对话片段
You: /opsx:explore 鉴权模块当前怎么工作的?
AI: 我已读完 src/auth/ 下 18 个文件。当前实现:
 - Cookie 名 'sid',HMAC 签名(密钥在 env.SESSION_SECRET)
 - 中间件 authMiddleware 在 4 个 entry point 装载
 - 但 src/legacy/admin.ts 直接 query session 表绕过中间件 ⚠️
 - redis session store + 本地 fallback(旧版兼容)
 发现 3 个隐藏行为:
  1. 邮箱大小写敏感(与新 spec 不符)
  2. session 永不主动失效,只靠 30 天 ttl
  3. 有一个未使用的 oauth_state 表
 这些应在重构前与你确认是 bug 还是有意为之。
产出
  • openspec/specs/auth/ 包含完整鉴权规范(重构后的目标态)
  • openspec/changes/archive/2026-05-XX-refactor-auth/ 完整变更历史
  • 新代码 + 1 个 migration script(兼容旧 cookie 格式)
关键 Tip

OpenSpec 在 brownfield 的真正威力:它把"反向工程现有代码"变成了 spec。半年后你或同事再读这个 specs/auth/,能秒懂"这个项目的鉴权约定是什么"。

示例 O2 · 后端 API 接口先定义后实现
场景:后端给前端提供新 API · 双方需要先对齐 contract
场景

前端组催你提供"用户消息批量已读"接口。你想先把 contract 敲定,避免后期反复改。

命令链
/opsx:propose api-mark-messages-read

# 生成的 specs/messages/spec.md 中明确:
# - 请求方法 POST /api/messages/read
# - 请求体 { ids: string[] }(max 100)
# - 响应 200 { updated: number }
# - 401 未登录、403 无权限他人消息、422 参数错误
# - 幂等性:重复调用不报错
# - 边界:ids 为空返回 200 updated:0

# 把 spec 链接发给前端
# 前端 OK 后再
/opsx:apply
关键 Tip

API 设计阶段就把 spec commit 到 repo,前端能在 repo 里看到、commit 历史里看到、CI 中可校验(如果你接 OpenAPI/JSON Schema)。比 Figma/飞书文档"漂浮"在外面强多了。

示例 O3 · 多人协作开发同一功能
场景:3 个工程师 + 1 个产品 · 一周内做完支付重构
场景

3 人小队要做支付重构。每人负责一块,但需要保持 API 和数据约定一致。

命令链
# 切换到 expanded profile(多人协作模式)
openspec config profile expanded
openspec update

# 产品负责人先开 propose
/opsx:propose payment-v2

# review proposal/design 之后 commit + push
git add openspec/changes/payment-v2 && git commit && git push

# 工程师 A:
/opsx:new sub-task-1-stripe-integration

# 工程师 B(在 A 完成 sub-task-1 后):
/opsx:continue   # 检查 tasks.md 进度,接着做 sub-task-2

# 工程师 C:
/opsx:ff sub-task-3-refunds  # 快进到自己负责的部分

# 周末整体验收:
/opsx:verify     # 跨 sub-task 一致性校验
/opsx:bulk-archive   # 全部归档
关键 Tip

expanded profile 是 OpenSpec 的隐藏强力技能,专为多人协作设计。/opsx:continue 让接手者无需读你的 chat 记录就能精确知道做到哪了。

示例 O4 · 合规变更追溯(金融/医疗场景)
场景:每个变更都要可审计 · 半年后被审计员问起怎么办
场景

金融行业项目,每个变更都需要"为什么改、谁批准、改了什么"的完整追溯。审计员可能 6 个月后来抽查。

命令链
# 在 openspec/config.yaml 强制规则
rules:
  proposal:
    - 必须包含 "Compliance Impact" 章节
    - 必须列出 affected regulations (SOX, PCI-DSS 等)
    - 必须有 reviewer 签字字段
  archive:
    - 归档时附带 audit trail (谁 review、何时 approve)

# 每个变更:
/opsx:propose update-transaction-limits
# proposal 自动包含合规章节
# CISO 在 proposal.md 中签字注明 approved
git commit  # 留下 git history
/opsx:apply
/opsx:archive  # 归档,永久保留
关键 Tip

审计员 6 个月后问"为什么 5 月 12 号改了交易限额?"——你打开 openspec/changes/archive/2026-05-12-update-transaction-limits/,proposal/design/tasks 一目了然,谁批准、什么风险评估都在。这是其他工具完全做不到的。

示例 O5 · 大规模迁移(数据库 / 框架升级)
场景:MySQL 5.7 → PostgreSQL 16 · 涉及 50+ 文件
场景

要把 MySQL 5.7 迁到 PostgreSQL 16。改动会涉及 50+ 文件,可能跨越几周。

命令链
# 总 proposal
/opsx:propose migrate-mysql-to-postgres

# 拆 5 个 sub-changes
/opsx:propose migrate-step-1-schema-translation
/opsx:propose migrate-step-2-orm-update
/opsx:propose migrate-step-3-query-rewrite
/opsx:propose migrate-step-4-data-migration
/opsx:propose migrate-step-5-cleanup-mysql

# 每个 step 独立可逆,独立 ship
# 第 1 step:
/opsx:apply migrate-step-1-schema-translation
# 测试通过后归档,但保留总 proposal
/opsx:archive migrate-step-1-schema-translation
关键 Tip

大型迁移最怕"做到一半被打断"。OpenSpec 的子提案让每一步都独立成 PR、独立可回滚。即使停 2 周再继续,也能精确回到原点。

3. Superpowers 单独使用:5 个示例

Superpowers 最适合"让 AI 自己干,你休息"的场景。它的 subagent + plan + TDD 链能实现长时无人值守。

示例 S1 · 夜间长时执行:写一个完整 CLI 工具
场景:晚上睡前布置任务 · 早上起来看结果
场景

你要写一个跨平台 CLI 工具:参数解析 + 子命令 + 配置文件 + 彩色输出 + 单元测试。

命令链
You: 我想做一个叫 myctl 的命令行工具,需要支持
     init/add/remove/list 4 个子命令,配置文件读 ~/.myctl.yaml
     用 TypeScript + Bun 写

# 自动触发顺序(你不用手动 /xxx):
1. brainstorming           — 问 6 个问题挑战需求
2. writing-plans           — 拆成 14 个 2-5 分钟的 task
3. (你说 "go" 后)
4. using-git-worktrees     — 创建 isolated worktree
5. subagent-driven-development — 每个 task 派一个新 subagent
6. test-driven-development — 每个 task 强制先写 test
7. requesting-code-review  — 任务间自动 review
8. finishing-a-development-branch — 完成后选 merge / PR
实战日志(节选)
[22:30] brainstorming: 14 个澄清问题完成
[22:35] writing-plans: 14 个 task 计划已写入 plan.md
[22:36] You: go
[22:36] git worktree add ../myctl-feat feature/init
[22:37] Subagent-1: task-1 (init 子命令)
        TDD RED: 写测试 init creates ~/.myctl.yaml ... ✗ FAIL
        TDD GREEN: 实现 src/commands/init.ts ... ✓ PASS
        review: 通过
[22:42] Subagent-2: task-2 (add 子命令)
[...每个 subagent 4-6 分钟...]
[01:18] task-13 完成
[01:24] task-14 完成(文档)
[01:25] finishing-branch: 测试 47 个全过,提示是否 PR
[早上 8 点]
You: 看见 plan 100% 完成,发个 PR 吧
AI: 已开 PR #42,等你 review
关键 Tip

这是 Superpowers 的核心红利。其它工具的 Agent 主流程是"边写边问",1 小时后会偏离原计划。Superpowers 的 subagent 每个跑完即退出,主 Agent 只负责调度,不会被污染上下文。

示例 S2 · 复杂 Bug 系统化调试
场景:偶发 race condition · 重启就好 · 一天复现 1 次
场景

测试同事报"系统偶尔会显示空白页面",每天发生 1-3 次,重启服务就好。你怀疑 race condition 但找不到。

触发的 skill
You: 帮我修这个偶发空白页 bug
     测试日志在 logs/2026-05-15-bug.log

自动触发:
1. systematic-debugging   — 4 阶段方法论
2. (reproduce 阶段)condition-based-waiting 找出触发条件
3. (isolate 阶段)root-cause-tracing 反向追踪数据流
4. (fix 阶段)defense-in-depth 多层防御
5. verification-before-completion — 必须证明已修
对话片段
AI: 启用 systematic-debugging。
阶段 1: REPRODUCE
 日志中 21 次空白页都发生在 60s 内有 ≥3 个并发请求时。
 已写脚本 stress-test.ts 模拟,本地 100% 复现。

阶段 2: ISOLATE
 root-cause-tracing:用户请求 → SSR → 数据 fetch...
 发现:getServerSideProps 中的 globalCache 是
 模块级变量,第二个请求覆盖了第一个的 ctx。

阶段 3: FIX
 defense-in-depth:三层防御
  L1: globalCache 改为 per-request scope
  L2: 加 invariant 断言不允许跨请求复用
  L3: 加 telemetry 监控异常情况

阶段 4: VERIFY
 verification-before-completion:
 - 跑 stress-test 1000 次,0 个失败 ✓
 - 单元测试覆盖了 race 场景 ✓
 - 部署 staging 监控 30 分钟 ✓
 已确认修复(不仅"我觉得修了")。
关键 Tip

systematic-debugging 的 4 阶段顺序不可跳跃。新手最爱直接跳到 FIX,结果"修了一处坏了三处"。这个 skill 强制你必须先复现、再隔离、再修。

示例 S3 · 重构遗留代码(强制 TDD)
场景:把 800 行的 god function 拆成模块 · 不能改行为
场景

有个 800 行的 calculatePricing 函数,已经多次改坏过。你想拆成 5 个小函数,但不能改任何行为。

关键技巧:先 characterization tests
You: 重构 calculatePricing,要求行为完全不变

自动触发:
1. test-driven-development
   先生成 characterization tests(覆盖现有所有行为)
   测试必须 100% 通过 = 拿到"不变量"
2. writing-plans
   拆成 5 个 refactor task
3. subagent-driven-development
   每个 subagent 拆一块,跑特征测试,不通过则回滚
对话片段
AI: 启用 TDD 模式重构。
第 0 步:写 32 个 characterization tests 覆盖现有行为
 - 7 个边界(0、负数、null、empty)
 - 12 个折扣组合
 - 8 个货币转换
 - 5 个 promo code
 全部 PASS ✓ —— 现在我有"行为快照"

Refactor 1: 抽 calculateBasePrice
 跑 32 个 test... 32/32 PASS
Refactor 2: 抽 applyDiscounts
 跑 32 个 test... 31/32 PASS ⚠️
 回滚!触发 verification-before-completion
 发现:promo "VIP" 的折扣顺序变了
 修复后再跑... 32/32 PASS ✓
关键 Tip

TDD 在重构里是救命稻草。先把现有行为冻结成测试,重构每一步都验证不变。这是手工重构很难做到的纪律。

示例 S4 · 并行多任务(5 个独立 feature)
场景:sprint 后期 · 5 个小 feature 互不依赖 · 想并行
场景

sprint 还剩 5 个小 feature:邮件模板、导出 CSV、深色 favicon、404 页、健康检查端点。彼此独立。

命令链
You: 并行做这 5 个 feature
     [feature 1-5 描述]

自动触发:
1. dispatching-parallel-agents
   - 检测 5 个任务无依赖
   - 用 git worktree 创建 5 个分支
   - 派 5 个 subagent 并行执行
2. 每个 subagent 内部走 brainstorming → writing-plans → TDD
3. 完成后主 Agent 汇总结果,5 个分支独立 PR
实测 ROI

串行执行预估 6 小时,并行 4 个 subagent + 主 Agent 汇总:1.8 小时完成。Token 用量增加 4.5 倍但时间省 3.3 倍。

关键 Tip

使用前确认任务真的独立。如果 task 2 依赖 task 1 的某个 util 函数,并行会失败。Superpowers 会先做依赖检测,但有时检测不出语义层耦合。

示例 S5 · 实现新算法(纯 TDD)
场景:写一个文本相似度算法 · 学术正确性优先
场景

要实现 Levenshtein 距离 + 余弦相似度 + Jaro-Winkler 三种算法,用于文档去重。学术正确性优先。

流程
You: 实现 3 种文本相似度算法,用 TDD

# Superpowers 强制 TDD 流程:
# 对每个算法都跑 RED-GREEN-REFACTOR:

[RED]
- 写测试:levenshtein("kitten", "sitting") === 3
- 跑测试 → ✗ FAIL(函数还不存在)

[GREEN]
- 写最少代码让测试通过(即使是 hardcoded)
- 跑测试 → ✓ PASS

[REFACTOR]
- 把硬编码改成真正的 DP 算法
- 加更多测试用例
- 跑测试 → ✓ PASS

# 三个算法 × 3 个循环 = 9 步骤
对话片段
You: 我已经写了 levenshtein 实现,跳过 RED 阶段直接测试
AI: ❌ 检测到违反 TDD 顺序。
 test-driven-development skill 规定:
 "Deletes code written before tests."
 已删除你的 src/levenshtein.ts。请:
 1. 先写测试用例(建议参考维基百科测试集)
 2. 跑测试看到 RED
 3. 再写实现达到 GREEN
关键 Tip

算法实现是 TDD 最有价值的领域之一——测试用例就是算法的形式化定义。Superpowers 的硬性 TDD 在这种场景下是优势而非负担。

4. 任意组合使用:5 个示例

三个工具互不冲突,可以叠加使用。下面 5 个组合涵盖最常见的真实开发场景。

示例 C1 · 三件套黄金配方:全栈新功能
场景:2-5 人小团队 · 做一个长期维护的核心功能
场景

给 SaaS 加"团队协作工作区"功能。需要:API 设计、UI 设计、可审计文档、代码质量、线上稳定。

完整流程图
/office-hours
挑战需求
/opsx:propose
产生 spec 4 件套
/plan-design-review
设计师视角
writing-plans
SP 拆细 task
subagent-dev
SP 长时执行
TDD
SP 强制测试
/qa
真浏览器
/review + /cso
代码 + 安全
/ship + /land
发布
/opsx:archive
spec 归档
对话片段
You: 给 SaaS 加 workspace 协作功能
AI: 启动黄金三件套流程。

第 1 阶段 (gstack):/office-hours
 6 个挑战问题... [省略] 共识:先做"项目级共享",
 不做"用户级权限矩阵"(v2 再说)。

第 2 阶段 (OpenSpec):/opsx:propose workspace-v1
 已生成:
 - proposal.md(why + what + non-goals)
 - specs/workspace/spec.md(API contract + 数据模型)
 - design.md(5 个 ASCII 架构图)
 - tasks.md(21 个 task)

第 3 阶段 (Superpowers):自动检测到 plan,
 writing-plans 把 21 个 task 进一步拆到每个 ≤5 分钟
 subagent-driven-development 调度 21 个独立 subagent
 TDD 强制每个 task 先写 test
 [3 小时后] 21/21 完成

第 4 阶段 (gstack)
 /qa: 5 个用户 flow 全过
 /review: 自动修 3 处,标记 1 处需你拍板
 /cso: 0 高危
 /ship: PR #87 已开
 /land-and-deploy: 部署成功

第 5 阶段 (OpenSpec):/opsx:archive workspace-v1
 spec 永久归入 openspec/specs/workspace/
最终产出("对齐三方")
给谁看的产物
团队 / 产品经理OpenSpec 的 proposal.md + specs/
未来的你 / 同事archive 历史 + git log
线上用户已部署的功能 + Sentry 监控
审计 / 合规specs/ 全量可追溯
设计师/design-review 的视觉打分报告
关键 Tip

这是生产项目最强组合。每个工具发挥自己的强项,互不重复:
① gstack 管"做对的产品"
② OpenSpec 管"对齐到 spec"
③ Superpowers 管"把代码做对"

示例 C2 · OpenSpec + Superpowers:合规项目
场景:金融/医疗 · 没有用户 UI · 后端 + 数据 pipeline
场景

纯后端服务(消息队列、数据 pipeline、定时任务)。要审计追溯、要 TDD,但用不到浏览器 QA 和产品挑战。

命令链
# 1. OpenSpec 设计 spec(合规审计)
/opsx:propose pipeline-v2-data-encryption

# 2. CISO review proposal/design.md,签字
git commit -m "approved by CISO 2026-05-20"

# 3. Superpowers 拆 task + TDD 实现
You: 按 tasks.md 实现

[自动激活]
- writing-plans 把 OpenSpec tasks.md 进一步拆细
- subagent-driven-development 长时执行
- test-driven-development 每个 task 强制 TDD
- verification-before-completion 验证

# 4. 不需要 gstack(无 UI)
# 5. 归档
/opsx:archive pipeline-v2-data-encryption
关键 Tip

C2 配方省掉 gstack是合理的——纯后端服务没有视觉、没有浏览器流,gstack 的 /qa /design-* 都用不上。但如果你的后端服务对外暴露了 admin UI 或 metric dashboard,那还是建议加上 gstack。

示例 C3 · gstack + Superpowers:单人创业开发
场景:独立开发者 · 个人项目 · 不需要复杂文档
场景

你一个人做一个小工具或独立项目。需要快速 ship,需要纪律但不需要团队对齐文档。

命令链
# 1. 需求挑战(gstack)
/office-hours

# 2. 计划 + 实现(Superpowers)
[自动触发 brainstorming → writing-plans → 
 subagent-driven-development → TDD]

# 3. QA + 发布(gstack)
/qa https://staging
/review
/ship
/land-and-deploy

# 4. 复盘(gstack)
/retro
为什么不用 OpenSpec

个人项目里 OpenSpec 的 ROI 偏低:你自己脑子里清楚为什么改、改了什么。spec 文档只是给"未来的你"看,但小项目通常活不到那时候。

关键 Tip

这是独立开发者最佳组合。简洁、快速、有质量保证。如果项目从 PoC 变成认真做的产品,再加上 OpenSpec。

示例 C4 · OpenSpec + gstack:内部工具/管理后台
场景:公司内部工具 · 几个人用 · 改动需文档化但不需要 TDD 强约束
场景

给运营做的报表后台。功能简单(CRUD + 图表),但每次改动要让其他运营知情,部署要稳定。

命令链
# 1. spec 文档(OpenSpec)让运营了解
/opsx:propose add-monthly-report-export

# 2. 直接让 Agent 实现(不强制 TDD,运营工具改动太频繁)
You: 按 tasks.md 实现,写关键单元测试就行

# 3. UI 用 gstack 改进
/design-shotgun
/design-html

# 4. 测试 + 发布
/qa
/review
/ship
/opsx:archive
关键 Tip

内部工具的改动节奏快、需求漂移大。跳过 Superpowers 的 TDD 强制是合理选择——每次都强制 RED-GREEN-REFACTOR 反而拖慢进度。但 spec(让运营了解)和 QA(避免线上卡死)不能省。

示例 C5 · 三件套救火:生产事故响应
场景:线上重大事故 · 1 小时内必须有解 · 但不能再出问题
场景

支付服务挂了 30 分钟,已恢复但根因不明。要在 1 小时内做出 hotfix,且必须有完整事故记录给老板和合规。

分秒级命令链
# T+0:00  事故发生 → 已快速回滚

# T+5:00  开 incident spec(OpenSpec)
/opsx:propose incident-2026-05-20-payment-outage

# T+10:00 系统化调查(gstack)
/investigate
[8 分钟后定位到 redis 连接池耗尽]

# T+25:00 Superpowers TDD 实现修复
You: 按 investigate 输出实现 hotfix
[Superpowers: 先写复现 race 的测试 → 修复 → 验证]

# T+45:00 安全审查(gstack)
/review --hotfix
/cso --focus "auth,payment"

# T+50:00 发布
/ship --hotfix
/land-and-deploy --priority urgent

# T+58:00 监控
/canary --duration 30m

# T+次日   归档
/opsx:archive incident-2026-05-20-payment-outage
# 含 RCA、timeline、修复细节、防御措施
事故 spec 包含
  • Timeline: 每分钟事件(来自 git commits + monitoring)
  • Root Cause: /investigate 输出
  • Fix: 实际改动(含 TDD 写的测试)
  • Verification: /qa /canary 截图 + 监控数据
  • Prevention: 防止再次发生的措施
关键 Tip

事故响应中"快"和"稳"必须同时——三件套刚好对应这两个维度:gstack 给你快速调查 + 部署,Superpowers 给你 TDD 验证防止"修出新 bug",OpenSpec 给你完整事故记录。

5. 日常开发最佳实践

5.1 一周节奏

把三个工具放进一周开发节奏里:

周一上午 · Sprint 启动
  • gstack /office-hours × 每个新需求一次(≤30 分钟)
  • OpenSpec /opsx:propose × 每个改动写 spec(spec review 在午饭前完成)
  • 下班前:gstack /autoplan 跑一遍多视角联审
周二-周四 · 实现期
  • Superpowers 的 brainstorming + writing-plans + subagent 自动驱动
  • 每天早上确认 plan 进度(多数情况 60-80% 自动完成)
  • 每个 task 完成自动 Superpowers requesting-code-review
  • 写 git commit message 时遵循 conventional commits
周五上午 · 测试 + 发布
  • gstack /qa × 每个新页面 / 流程
  • gstack /review + /cso
  • gstack /ship + /land-and-deploy
周五下午 · 复盘
  • gstack /retro 看本周 ship 节奏
  • OpenSpec /opsx:archive 把已完成变更归档
  • gstack /learn 把本周新踩的坑写进项目记忆

5.2 一天的节奏(90 分钟番茄钟单元)

单元 1 · 09:00-10:30 思考期
  • 新需求触发 /office-hours,挑战 6 问
  • 清晰后 /opsx:propose 生成 spec
  • 看 design.md,纠正 AI 误读
  • 不要写代码,思考期专注思考
单元 2 · 10:45-12:15 启动期
  • 给 Agent 说 "go",Superpowers 自动激活 plan + subagent
  • 你做监督:每 15 分钟看一眼 plan 进度
  • 不要打断 subagent,让它跑完 task 再插话
单元 3 · 14:00-15:30 推进期
  • 大部分自动跑,你做并行其他事
  • Agent 偶尔会 AskUserQuestion,及时回答
  • 避免开新需求打断主流程
单元 4 · 15:45-17:15 收尾期
  • /qa 跑用户流测试
  • /review 找隐藏 bug
  • /ship 推 PR
  • 把 PR 链接发同事 review
下班前 5 分钟
  • /learn 把今天踩的坑记下
  • 检查所有 worktree(Superpowers 有时会留):git worktree list
  • 如有未合并 hotfix,明早第一件事处理

5.3 10 条铁律(来自实战)

1需求挑战永远不省

无论用哪个工具,第一步永远是挑战需求(/office-hours / brainstorming / /opsx:explore)。这是最高 ROI 的 5 分钟

2spec 一定要 commit

OpenSpec 的 changes/ 和 specs/ 必须 commit 到 repo。本地 spec 等于没有 spec。

3子 Agent 不要打断

Superpowers 派出的 subagent 在跑时不要插话。要等它完成或失败后再介入。打断会污染上下文,让后续 task 偏离。

4测试覆盖双层

下层用 Superpowers TDD(unit/integration),上层用 gstack /qa(E2E/visual)。两者不可替代。

5review 是必经关卡

所有合并前必须 /review。它会找 CI 通过但生产爆炸的隐藏问题。

6生产事故走完整流程

哪怕"明显是某个原因"也要走 /investigate。3 次失败修复护栏会救你。

7worktree 谁开谁关

Superpowers 的 git worktree 用完要 finishing-a-development-branch 收尾,否则一周后你会发现有 8 个孤儿分支。

8archive 是知识沉淀

每个 OpenSpec change 必须 archive。半年后回看,就是项目的设计史。

9用户指令优先级最高

三个工具都尊重 CLAUDE.md/AGENTS.md。在项目根写明你的偏好(如"PoC 阶段不要 TDD"),所有 skill 都会让步。

10每周 retro 一次

/retro global 跨工具看本周 ship 节奏。这是优化工作流的反馈回路

5.4 速查 Checklist

开新功能前 ✅

检查项工具命令
需求是否真挑战过gstack/office-hours
spec 是否对齐OpenSpec/opsx:propose
设计是否过 reviewgstack/plan-design-review
架构是否过 reviewgstack/plan-eng-review

实现中 ⚙️

检查项工具命令/Skill
是否在 worktree 隔离Superpowersusing-git-worktrees
plan 是否拆到 ≤5 分钟/taskSuperpowerswriting-plans
是否先写 testSuperpowerstest-driven-development
edit 范围是否锁定gstack/freeze

合并前 🚀

检查项工具命令
真实浏览器测过gstack/qa <url>
review 跑过gstack/review
安全扫描gstack/cso
验证完成Superpowersverification-before-completion
spec 已 archiveOpenSpec/opsx:archive
文档同步gstack/document-release

每周 📊

检查项工具命令
retro 复盘gstack/retro global
升级 gstackgstack/gstack-upgrade
升级 OpenSpecOpenSpecnpm i -g @fission-ai/openspec@latest && openspec update
升级 SuperpowersSuperpowers各 host 自动 / 手动重装
清理孤儿 worktreeGitgit worktree prune
✅ 终极简化:3 句话记住怎么用
  1. 不知道做什么 →/office-hours,再 /opsx:propose
  2. 知道做什么了 → Superpowers 自己动起来,TDD + subagent
  3. 要 ship 了 → /qa /review /ship /land-and-deploy 一条龙