gstack 深度分析报告:Garry Tan 的 AI 软件工厂

2026-03-23

gstack 深度分析报告:Garry Tan 的 AI 软件工厂

40K Stars,28 个专业技能,把 Claude Code 变成虚拟工程团队


执行摘要

项目概览
- 作者:Garry Tan(Y Combinator CEO)
- Stars:40,080(2026-03-23)
- 语言:TypeScript
- 定位:Claude Code 的专业技能包

核心价值:把 AI 助手变成一个完整的虚拟工程团队——CEO、设计师、工程经理、QA、安全官、发布工程师,每个角色都是专业技能。

关键数据
- 60 天内产出 600,000+ 行生产代码
- 日均 10,000-20,000 行代码
- 单周 140,751 行新增,362 次提交
- 2026 年已贡献 1,237 次(超过 2013 年 772 次的峰值)


一、项目背景

1.1 作者背景

Garry Tan 是谁?
- Y Combinator 现任 President & CEO
- Palantir 早期工程师/PM/设计师
- Posterous 联合创始人(被 Twitter 收购)
- YC 内部社交网络 Bookface 的创建者
- 投资了 Coinbase、Instacart、Rippling 等公司

他在 README 中说:"我做了二十年产品,现在是我产出代码最多的时候。"

1.2 项目起源

项目灵感来自 Andrej Karpathy 的一句话:

"I don't think I've typed like a line of code probably since December."
— Andrej Karpathy, No Priors podcast, March 2026

Garry Tan 听到后想:一个人怎么能像 20 人的团队一样交付?Peter Steinberger 用 AI agents 几乎独立完成了 OpenClaw(247K stars)。答案是:正确的工具链

1.3 核心理念

gstack 的核心是 流程,不是工具集合:

Think → Plan → Build → Review → Test → Ship → Reflect

每个技能都知道上游发生了什么,下游需要什么。设计文档自动流入计划评审,测试计划自动流入 QA,代码审查结果自动流入发布流程。


二、技能体系

2.1 核心技能(15 个)

技能 角色 职责
/office-hours YC Office Hours 六个强迫性问题,重新定义产品
/plan-ceo-review CEO/创始人 找到需求里的 10-star 产品
/plan-eng-review 工程经理 锁定架构、数据流、边界条件
/plan-design-review 高级设计师 交互式设计评审,AI 水印检测
/design-consultation 设计合伙人 从零构建完整设计系统
/review Staff 工程师 发现 CI 通过但生产会炸的 bug
/investigate 调试器 系统性根因分析,不调查不修复
/design-review 会写代码的设计师 80 项视觉审计 + 自动修复
/qa QA 负责人 真实浏览器测试,自动生成回归测试
/qa-only QA 报告员 只报告 bug,不改代码
/cso 首席安全官 OWASP Top 10 + STRIDE 威胁建模
/ship 发布工程师 同步、测试、推送、开 PR
/land-and-deploy 发布工程师 合并 PR → CI → 部署 → 验证
/canary SRE 部署后监控循环
/document-release 技术文档 更新所有文档匹配最新代码

2.2 Power Tools(8 个)

技能 功能
/codex OpenAI Codex 独立代码审查
/careful 危险命令警告(rm -rf、DROP TABLE)
/freeze 编辑锁定,只允许修改指定目录
/guard /careful + /freeze 组合
/unfreeze 解除编辑锁定
/browse 真实 Chromium 浏览器,~100ms 命令
/setup-browser-cookies 导入浏览器 cookies
/gstack-upgrade 自升级到最新版本

2.3 技能设计哲学

/office-hours 的重新定义

用户说:"我想做一个日历简报应用。"

普通 AI 助手会加一个文件选择器保存图片。

gstack 的 /office-hours 会说:

"我要挑战你的框架。你说的是'日历简报应用',但你实际描述的是一个个人参谋长 AI。"

然后提取出用户没意识到的五个能力:
1. 跨所有账户监控日历,检测过期信息
2. 生成真正的准备工作——不是物流摘要,而是会议的智力工作
3. 管理你的 CRM——谁在开会,关系是什么,他们想要什么
4. 优先安排你的时间——主动标记需要提前准备的事项
5. 用钱换杠杆——主动寻找委托或自动化的方式

/plan-ceo-review 的 Brian Chesky 模式

不是实现显而易见的 ticket,而是从用户视角重新思考问题:

"这个产品到底是用来做什么的?"

例子:用户说"让卖家上传照片"。
- 弱助手:加一个文件选择器
- gstack:问"照片上传"是不是真正的功能?也许真正的功能是帮助用户创建一个真正能卖出去的列表

然后提出一系列问题:
- 能从照片识别产品吗?
- 能推断 SKU 或型号吗?
- 能自动搜索网络并生成标题和描述吗?
- 能检测照片是否丑陋、昏暗、杂乱吗?


三、技术架构

3.1 核心挑战

AI agent 操作浏览器的两个需求:
1. 亚秒延迟:每个命令不能等 3-5 秒浏览器启动
2. 持久状态:cookies、tabs、登录会话不能丢失

3.2 Daemon 模型

Claude Code  →  CLI (compiled binary)
                     ↓ HTTP POST
               Server (Bun.serve)
                     ↓ CDP
               Chromium (headless)

关键设计
- 首次调用启动服务(~3s)
- 后续调用:~100-200ms
- 30 分钟空闲自动关闭
- 随机端口(10000-60000),支持 10 个并发工作区

3.3 为什么选 Bun

特性 Bun 优势
编译二进制 58MB 单文件,无需 node_modules
原生 SQLite 直接读取 Chromium cookies 数据库
原生 TypeScript 开发时无需编译
内置 HTTP 不需要 Express/Fastify

3.4 安全模型


四、竞品对比

项目 Stars 定位
gstack 40K Garry Tan 的完整工作流
awesome-claude-code 30K Claude Code 技能精选列表
antigravity-awesome-skills 27K 1300+ 技能库
claude-plugins-official 14K Anthropic 官方插件目录

gstack 的差异化
- 完整的流程而非工具集合
- YC CEO 的实战经验沉淀
- 每个技能都知道上下游发生了什么


五、使用场景

5.1 适合谁

用户类型 推荐理由
创始人和 CEO 技术创始人仍然想亲自交付代码
首次使用 Claude Code 结构化角色替代空白提示
技术负责人 每个 PR 都有严格的审查、QA、发布自动化

5.2 典型工作流

1. /office-hours     → 重新定义产品,生成设计文档
2. /plan-ceo-review  → CEO 视角评审计划
3. /plan-eng-review  → 工程视角锁定架构
4. [实现代码]         → AI 自动生成
5. /review           → Staff 工程师代码审查
6. /qa               → QA 负责人真实浏览器测试
7. /ship             → 发布工程师推送 PR
8. /land-and-deploy  → 合并、部署、验证
9. /retro            → 周回顾,团队洞察

5.3 安装(30 秒)

# 安装到本地
git clone https://github.com/garrytan/gstack.git ~/.claude/skills/gstack
cd ~/.claude/skills/gstack && ./setup

# 添加到项目(可选,让队友也能用)
cp -Rf ~/.claude/skills/gstack .claude/skills/gstack
cd .claude/skills/gstack && ./setup

六、社区与生态

6.1 GitHub 数据

6.2 热门 Issues

  1. gstack-pr-triage:社区 PR 分类和排序
  2. browse MCP tool manifest generator:暴露 browse 命令给 MCP
  3. connect to existing Chrome via CDP:连接现有 Chrome
  4. customer-insight skill:The Mom Test 执行器
  5. support for Gemini, Cursor:多模型支持

6.3 HN 讨论


七、关键洞察

7.1 产品哲学

  1. 流程 > 工具:技能之间的衔接比单个技能更重要
  2. 重新定义问题:不是"怎么做这个功能",而是"这个产品到底是用来做什么的"
  3. YC Office Hours 精神:六个强迫性问题,不舒服但必要

7.2 技术创新

  1. Daemon 模型:解决浏览器持久化和延迟问题
  2. Bun 编译:单文件部署,无需 node_modules
  3. 版本自动重启:binary 版本不匹配自动重启服务

7.3 商业模式


八、对中国开发者的意义

8.1 可借鉴点

  1. 角色化 AI:把通用 AI 助手变成专业角色(CEO、设计师、QA)
  2. 流程自动化:每个步骤的输出自动成为下一步的输入
  3. 亚秒延迟:daemon 模型解决浏览器操作延迟问题

8.2 局限性

  1. 语言:主要面向英文用户
  2. 支付:Claude Code 本身需要国际信用卡(参考我的 Claude Code 充值指南)
  3. 网络:部分功能可能需要代理

8.3 本土化机会


九、总结

gstack 是目前最完整的 Claude Code 工作流方案。它不是一个工具集合,而是一套软件工厂流程

核心价值
- 28 个专业技能,覆盖从需求分析到部署监控的全流程
- YC CEO 二十年产品经验的结晶
- 60 天 600,000+ 行代码的实战验证

适合人群
- 想用 AI 提升单人产出 10 倍的技术创始人
- 刚接触 Claude Code 需要结构化指导的开发者
- 追求高质量代码和严格流程的技术负责人

推荐行动
1. 安装 gstack(30 秒)
2. 运行 /office-hours 描述你的项目
3. 运行 /plan-ceo-review 重新审视你的产品
4. 运行 /review/qa 体验完整的质量保障流程
5. 停在那里——你会知道这是否适合你


附录

数据来源

来源 置信度 说明
GitHub 官方 API L1 (95%) stars、forks、issues
README.md L1 (95%) 项目文档
ARCHITECTURE.md L1 (95%) 架构设计
HN 搜索 L3 (75%) 社区讨论
竞品分析 L2 (90%) GitHub 搜索

相关链接


报告生成时间:2026-03-23
调研方法:5 轮深度调研 + 多源交叉验证
数据截止:2026-03-23