Skip to content

AI 开发规范工具对比分析文档

整理时间: 2026-03-20 数据来源: GitHub、Medium、Reddit、掘金、vocus.cc、yuv.ai 等公开资料


一、行业背景

1.1 为什么需要规范驱动开发?

2024-2026 年,AI 编程工具爆发式增长,92% 的开发者在工作流中使用 AI 工具。但也带来了核心问题:

  • "Vibe Coding" 困境:需求散落在聊天记录中,缺乏持久化和系统化
  • AI 失忆:上下文窗口满了后,AI 出现"失忆"症状
  • 代码质量失控:AI 优化速度胜过质量,产出的代码像"意大利面条"
  • 不可预测:模糊的提示词导致不可预测的结果

"25% 的 Y Combinator Winter 2025 队列中有 95% 的代码是 AI 生成的" "行业领袖预测到 2027 年开发者将不再看代码" "规范正在成为编程的基本单位" —— Martin Fowler

1.2 规范驱动开发(SDD)的三种模式

模式描述代表工具
Spec-First规范先于代码,但用完即弃Spec-Kit、Kiro、BMad
Spec-Anchored规范持续存在和演进OpenSpec、Spec Kitty
Spec-as-Source只编辑规范,代码自动生成Tessl

二、工具详细对比

2.1 基本信息

维度SuperpowersSpec-KitGSDOpenSpecBMad MethodKiroTessl
Stars99.6K69.1K36.4K32.5K
维护者obra (社区)GitHub 官方TÂCHESFission-AI社区AWS商业
协议MITOpen SourceMITMITOpen SourceProprietaryProprietary
创建时间2025-102025 初2025-122025
核心创新TDD + 子代理宪法驱动上下文工程/波次管理变更管理21 AgentIDE 集成规范即源码

2.2 功能对比

功能SuperpowersGSDOpenSpecSpec-KitBMadKiro
设置时间几分钟几分钟5 分钟30 分钟数小时/天15-20 分钟
复杂度
TDD 强制✅ 严格部分
Git Worktree
增量修改支持最佳
子代理/Agent6 技能11 Agent21 Agent
上下文管理普通波次管理普通普通普通普通
上下文恢复部分✅ HANDOFF.json
仪表盘
多工具支持20+7+20+工具无关仅 Claude
输出量按需结构化文件~250 行~800 行非常详细中等
Token 消耗较高高(5-10x)

2.3 场景评分(基于 spec-compare 研究项目)

场景OpenSpecSpec-KitBMadSpec Kitty
从零开始新项目★★★★★★★★★★★★★★★
改造现有项目★★★★★★★★★★★★★★
小改动/bug 修复★★★★★★★★★★★
大型功能开发★★★★★★★★★★★★★★★★★
团队协作★★★★★★★★★★★★★★★★★
个人项目★★★★★★★★★★★
并行开发★★★★★★★★★★★

2.4 批评与局限

SDD 的共性问题:

  1. 瀑布回归:SDD 是否重新引入了瀑布流的官僚主义?
  2. AI 不遵守规范:AI agent 经常忽略规范
  3. 可扩展性疑问:不清楚 SDD 何时增加价值、何时是额外开销
  4. 历史教训:与失败的模型驱动开发(MDD)有相似之处

各工具的具体批评:

  • Spec-Kit:阶段门控太严格,增量修改笨拙
  • Kiro/BMad:小改动用大锤子
  • Tessl:封闭 Beta,不确定性高
  • OpenSpec:缺乏 git worktree 支持
  • Superpowers:TDD 严格到可能影响效率
  • GSD:Token 消耗是普通模式的 5-10 倍;简单任务杀鸡用牛刀

三、组合推荐方案

3.1 个人开发者(推荐)

方案 A:Superpowers + OpenSpec ⭐(最均衡)

想法 → brainstorm(Superpowers) → propose(OpenSpec)
     → plan(Superpowers) → apply(TDD + Superpowers)
     → review → archive(OpenSpec)
  • Superpowers 管工程流程(TDD、计划、子代理)
  • OpenSpec 管需求规范(变更跟踪、文档沉淀)
  • 互补不冲突,轻量高效

方案 B:GSD(自主开发型)

/gsd:discuss → /gsd:plan → /gsd:execute → /gsd:verify
  • 适合"设置好需求后让 AI 跑几小时"的模式
  • 波次管理解决上下文腐烂
  • 缺点:Token 消耗较高

3.2 大型团队

Spec-Kit + Superpowers

  • Spec-Kit 定义项目"宪法"和团队规范
  • Superpowers 管个人开发流程
  • 规范通过 Git 共享和 review

3.3 并行开发多功能

Spec Kitty + OpenSpec

  • Spec Kitty 是唯一内置 git worktree 的工具
  • OpenSpec 管需求变更
  • 适合同时开发多个 feature

四、工具选择决策树

你是什么规模?
├── 个人/小团队
│   ├── 想让 AI 自主干几小时?→ GSD
│   ├── 改造现有项目?→ OpenSpec
│   ├── 需要严格 TDD?→ Superpowers
│   ├── 两者都要?→ Superpowers + OpenSpec ⭐
│   └── 关注上下文质量?→ GSD(波次管理)
├── 中大型团队
│   ├── GitHub 重度用户?→ Spec-Kit
│   ├── 需要并行开发?→ Spec Kitty
│   └── 企业级复杂流程?→ BMad Method
└── 想尝试最前沿
    ├── 喜欢 IDE 一体化?→ Kiro
    └── 只想写规范?→ Tessl(Beta)

五、参考资源汇总

文章与博客

  1. GSD vs Spec Kit vs OpenSpec vs Taskmaster AI — Medium
  2. 6 Best Spec-Driven Development Tools for AI Coding in 2026 — Augment Code
  3. SDD frameworks vs AI Plan Mode (Reddit 讨论)
  4. OpenSpec vs Spec Kit vs BMad vs Kiro 对比
  5. OpenSpec Deep Dive
  6. AI 编程三剑客:Spec-Kit、OpenSpec、Superpowers 深度对比 — 掘金
  7. Superpowers: Stop AI from Writing Spaghetti — YUV.AI
  8. From Vibe Coding to Viable Coding — Medium
  9. Superpowers Plugin for Claude Code: How I Ship Big Features
  10. Superpowers: Why Spec-Driven Development Changes Everything
  11. Superpowers 完美结合 OpenSpec 实战教程 — vocus
  12. AI Coding Tools Comparison 2026

研究项目

  1. spec-compare: 6 款 SDD 工具深度对比 — 包含 11 款工具的详细分析

官方仓库

  1. Superpowers — 99.6K ⭐
  2. Spec-Kit — 69.1K ⭐
  3. GSD (Get Shit Done) — 36.4K ⭐
  4. OpenSpec — 32.5K ⭐
  5. Spec Kitty — 社区 fork,worktree 支持
  6. Flokay (Claude plugin for OpenSpec) — 18 ⭐
  7. GSD for Cursor — 60 ⭐
  8. GSD for OpenCode — 529 ⭐

论坛

  1. r/ClaudeCode — SDD 工具讨论活跃
  2. Hacker News: GSD 讨论 (460分/251评论) — 社区真实反馈

六、趋势展望

  1. 规范成为编程基本单位:从"写代码"到"写规范"
  2. Living Spec 平台:规范实时同步代码(如 Augment Code 的 Intent)
  3. 多 Agent 协作:从单 Agent 到专业 Agent 团队
  4. Git Worktree 标配:并行开发将成为标准能力
  5. 2027 年开发者可能不再直接看代码 — 行业趋势

本文档基于 2026 年 3 月公开资料整理,工具更新频繁,建议定期查看官方仓库获取最新信息。