01

从灵感到上线

了解 Agent Skills 如何让 AI 编程助手像资深工程师一样工作

想象你正在让 AI 帮你写一个 App

你告诉 AI:"帮我做一个待办事项 App"。几秒钟后,AI 给了你一串代码,页面跑起来了,你很开心。

但是——这段代码质量如何?有没有安全漏洞?能不能扛住真实用户的访问?能上生产环境吗?

大多数人的做法是:能跑就行,直接上线。结果呢?用户数据泄露、页面崩溃、功能异常……这些问题不是 AI 不够聪明,而是AI 太快了,快到跳过了所有质量关卡

💡
核心洞察

Agent Skills 就像给 AI 一本"资深工程师的操作手册"。AI 本身就像一台强力烤箱——它能烤出东西,但不知道该按什么菜谱、什么顺序来。Agent Skills 提供的就是那本菜谱:21 个结构化工作流,确保 AI 写出的每一段代码都经过定义、规划、构建、验证、审查和发布这六道关卡。

简单来说:没有 Agent Skills 的 AI 编程,就像没有安全带的跑车——快是快,但出事就是大事。

六阶段开发流水线

Agent Skills 把软件开发分成六个阶段,每个阶段都有对应的技能文件来指导 AI。就像工厂流水线一样,上一站的输出是下一站的输入,任何一站发现问题都会停下来解决。

1
DEFINE 定义

把模糊的想法变成清晰的需求

2
PLAN 规划

把需求拆解成可执行的小任务

3
BUILD 构建

一步一步写代码

4
VERIFY 验证

确保代码真的能跑

5
REVIEW 审查

上线前的质量关卡

6
SHIP 发布

安全地推到生产环境

📚
为什么是六个阶段?

这六个阶段不是凭空发明的——它们来自资深工程师和顶级团队的实战经验。每个阶段对应一类 Agent Skills 文件,总共 21 个技能分布在这六个阶段里。后续模块我们会逐一认识它们。

你会怎么选?

你让 AI 帮你写了一个用户登录功能,代码看起来能跑。下一步你应该?

02

认识 21 个技能

每个技能都是一份操作手册,教你和 AI 怎么一步步把代码写好

每个技能都是一份操作手册

想象你在做一道菜。食谱不会只写"把鸡煮熟"——它会告诉你需要什么食材、每一步怎么做、哪些地方容易出错、怎么判断做好了没。

Agent Skills 里的每个技能就是这样一个"食谱卡片"。它不只是一句口号,而是一份完整的 spec,包含了目标、步骤、规则和边界。

下面是一个真实的技能模板,来自 spec-driven-development(规格驱动开发)这个技能。左边是技能文件里写的格式,右边是每一条的意思:

SKILL SPEC ## Objective [What we are building and why.] [User stories or acceptance criteria.]   ## Commands [Build, test, lint, dev]   ## Project Structure [Directory layout with descriptions]   ## Code Style [Example snippet + key conventions]   ## Testing Strategy [Framework, test locations,] [coverage requirements]   ## Boundaries - Always: [...] - Ask first: [...] - Never: [...]
中文翻译
目标:我们在做什么,为什么做。用户的期望是什么。
命令:构建、测试、检查、运行——完整的命令列表。
项目结构:每个文件夹里放什么,为什么这样组织。
代码风格:代码应该长什么样,有哪些规则要遵守。
测试策略:怎么验证代码是对的,测什么、不测什么。
边界:必须做的 / 要先问的 / 绝对不做的。
💡
关键洞察

当你用 PRD 写清楚"要做什么",AI 就有了明确的导航地图。没有地图,AI 只能瞎猜。

六个阶段,21 个技能各就各位

这 21 个技能不是随便堆在一起的。它们按照软件开发的六个阶段排列,就像流水线一样,每个阶段有自己的职责。

🎯
Phase 1: DEFINE 定义

想清楚要做什么,把模糊的想法变成清晰的方案。

💡
idea-refine

把模糊想法变成清晰提案

📄
spec-driven-development

写 PRD 再动手

📋
Phase 2: PLAN 规划

把大目标拆成小任务,排好优先级。

📋
planning-and-task-breakdown

把需求拆成小任务

🔨
Phase 3: BUILD 构建

动手写代码,一小步一小步来。

🚀
incremental-implementation

一小步一小步写代码

🧠
context-engineering

给 AI 正确的信息

test-driven-development

先写测试再写代码

📖
source-driven-development

查官方文档,不瞎猜

🔍
doubt-driven-development

用新视角质疑每个决定

🎨
frontend-ui-engineering

界面设计和组件

🔌
api-and-interface-design

接口设计

🔎
Phase 4: VERIFY 验证

测试代码是不是真的能正常工作。

🌐
browser-testing-with-devtools

用浏览器工具测

🔬
debugging-and-error-recovery

系统化找 bug

🛡
Phase 5: REVIEW 审查

从质量、安全、性能等维度全面检查代码。

🔍
code-review-and-quality

五维度代码审查

code-simplification

简化代码

🔒
security-and-hardening

安全检查

performance-optimization

性能优化

🚀
Phase 6: SHIP 发布

安全上线,确保版本可控、流程自动化。

📁
git-workflow-and-versioning

代码版本管理

ci-cd-and-automation

自动化流程

🗑
deprecation-and-migration

代码退役和迁移

📝
documentation-and-adrs

写文档

🚀
shipping-and-launch

上线检查清单

反借口对照表

⚠️
AI 最爱找借口跳过质量关卡

当你让 AI 帮你写代码,它可能会说"先这样吧""后面再优化"。这些都是绕过质量检查的借口。下面是常见的借口和正确的应对方式:

💬
"先这样吧,后面再测"
AI 想跳过测试直接交付
🚨
🚫 红灯
没有测试的代码就是没验货的商品
💬
"这只是个小改动"
AI 觉得小改动不需要认真检查
🚨
🚫 红灯
小改动也能引入大 bug
💬
"安全以后再说"
AI 建议安全检查推迟到后面
🚨
🚫 红灯
安全不是阶段,是每行代码的约束
💬
"先让它跑起来"
AI 想跳过规范先写原型
⚠️
⚠️ 黄灯
原型可以快,但必须有验证计划
🎓
你的新习惯

听到 AI 说"先这样吧"的时候,立刻打开反借口对照表。红灯意味着必须停下来纠正,黄灯意味着可以继续但要有计划。

测一测

你的 AI 助手说"这个功能很简单,我直接写完再测试"。根据 Agent Skills 的理念,你应该?
03

技能如何协作

像工厂流水线一样,每个技能的输出是下一个技能的输入

流水线上的技能们

想象一个汽车工厂。底盘组搭好车架,发动机组装上动力系统,喷漆组涂上颜色,质检组逐项检查。每一组的成品,就是下一组的原材料。如果底盘歪了,后面的工序全白费。

在 Agent Skills 里,软件开发也是一条这样的流水线。每个阶段都有一个或多个技能在干活,它们产出的成果物会传递给下一个阶段:

1
DEFINE 定义 → 产出 Spec 需求文档

把"我想做一个登录功能"这种模糊想法,翻译成 AI 能看懂的详细规格:支持哪些登录方式、忘记密码怎么走、输错几次锁定……

2
PLAN 规划 → 产出任务清单

把需求拆成一个个可以独立完成的小任务:设计数据库表、写注册接口、做前端表单……每个任务都有明确的验收标准。

3
BUILD 构建 → 产出代码和测试

按照任务清单,一个一个地写代码。每写完一个任务就跑测试,确保没破坏之前的功能。就像工人每装好一个零件就检查一遍。

4
VERIFY 验证 → 产出问题报告

全面跑测试套件,模拟用户操作,找到隐藏的 bug。这一步就是质检——发现问题不丢人,带着问题上生产线才要命。

5
REVIEW 审查 → 产出审查通过

检查安全漏洞(比如密码有没有加密)、代码质量(命名是否清晰、逻辑是否简洁)、性能问题。相当于出厂前的终检。

6
SHIP 发布 → 产出上线软件

先部署到测试环境确认没问题,再推到生产环境,最后监控运行状态。就像新车先试驾,再交付给客户。

💡
关键洞察

每个阶段的产出都是下一个阶段的"原材料"。如果定义阶段写错了需求,后面的规划、构建、验证都会跟着错——就像底盘歪了,整辆车都是歪的。这就是为什么 Agent Skills 强调每个阶段都有质量关卡,问题越早发现越便宜。

技能们在群聊

下面是一个模拟的群聊窗口,展示六个技能如何像团队成员一样接力完成一个"用户登录"功能。点击"下一条"逐条查看,或点"全部播放"一键看完。

0 / 6 messages
📚
注意到什么了吗?

每条消息都在前一条的基础上推进。需求文档 → 任务清单 → 代码实现 → 测试补充 → 安全审查 → 部署上线。没有人跳步,没有人各自为战——这就是协作流水线的力量。

一个需求走过六个关卡

下面这个动画展示了"我想做一个登录功能"这句话是如何走过六个阶段的。点击"下一步"逐步观看,你会看到一个光点从一个阶段飞到下一个阶段——那就是数据在传递。

🎯
定义
📋
规划
🔨
构建
🔍
验证
🛡️
审查
🚀
发布
点击"下一步"开始
Step 0 / 7
💡
光点代表什么?

每次光点飞过去,就代表一个阶段的成果物传递到了下一个阶段。Spec 飞给规划 → 任务清单飞给构建 → 代码飞给验证 → 问题报告飞给审查 → 审查通过飞给发布。这就是技能之间的"数据流"。

你会怎么选?

如果构建阶段(BUILD)跳过了测试直接写完所有代码,最可能发生什么?

📚
为什么跳过测试是大忌?

没有测试保护,改一行代码就可能悄悄破坏其他功能——而且你还不知道。验证阶段找 bug 的成本是构建阶段的 10 倍以上。早发现早治疗,这个道理在软件开发里一样适用。

04

三位专家代理人

代码审查员、测试工程师、安全审计员——三个视角,一次全面体检

请三位专家来审你的代码

想象你要开一家餐厅。开业之前,你会请三位检查官来验收:

🍅
卫生检查员

检查食品安全——食材有没有过期、厨房有没有细菌

🍴
美食评论家

品尝菜品质量——味道好不好、摆盘精不精致、菜单合不合理

🔥
消防检查员

排查安全隐患——灭火器够不够、逃生通道通不通、电线有没有裸露

三位检查官看的都是同一家餐厅,但每个人看到的东西不一样。卫生检查员觉得没问题的,消防检查员可能发现逃生门被锁了。

Agent Skills 也是这样。在 REVIEW 审查阶段,它提供了三位"专家代理人",从三个不同的角度审查你的代码:

💡
核心洞察

一个人审查代码,难免有盲区。代码审查员关注质量,测试工程师关注覆盖,安全审计员关注漏洞——三者缺一不可。就像一家餐厅不可能只通过卫生检查就开业,代码也不能只通过一个维度的检查就上线。

三位专家的身份卡片

下面是三位专家代理人的详细资料。每个人都有一套自己的审查哲学和铁律。

👁
代码审查员(Code Reviewer)

资深工程师的视角。从五个维度审查代码:正确性、可读性、架构、安全性、性能。就像一位经验丰富的编辑审稿——不只是挑错,更是帮你把文章写得更好。

铁律

审查范围控制在约 100 行代码以内,太大了就拆分。一次看太多代码 = 走马观花 = 看不出问题。

变更描述第一行用简短祈使句,正文说明是什么和为什么
🧪
测试工程师(Test Engineer)

QA 专家的视角。关注测试金字塔:80% 单元测试、15% 集成测试、5% 端到端测试。就像质检员验货——不是抽一个看一眼,而是每种情况都测到。

铁律

测试行为,不测实现细节。用 DAMP(描述性,好理解)而非 DRY(不重复,省代码)。测试代码写得清楚比写得短更重要。

Beyonce 规则:如果它能出问题,就需要测试
🔒
安全审计员(Security Auditor)

安全工程师的视角。对抗 OWASP Top 10(十大 Web 安全漏洞),三层边界防护。就像保安巡逻——不放过任何可疑角落。

铁律

所有外部输入都是恶意的,所有密钥都是神圣的,所有权限检查都是必须的。不信任任何人,包括你自己。

三层边界:必须做 / 先确认 / 绝对不做
💡
Beyonce 规则是什么?

这个名字来自 Beyonce 的歌词"If you liked it then you should have put a ring on it"——换个说法就是:如果你在乎它(某个功能、某个场景),你就应该给它写测试。"如果它能断,就测它。"这是测试工程师的核心信条。

三位专家如何分工

下面这张架构图展示了三位专家是如何分工的。同一份代码提交上去,三位专家各自从不同角度审查。点击任意角色,了解它关注什么。

💻 你的代码
📄 代码提交
👥 三位专家
👁 代码审查员
🧪 测试工程师
🔒 安全审计员
点击任意角色了解它关注什么
📚
为什么需要三个视角?

代码审查员可能觉得"代码写得挺干净的",但安全审计员会一眼看到密码明文存储。测试工程师可能觉得"测试覆盖率 90% 够了",但代码审查员会发现测试全在测实现细节而不是行为。三个视角互补,才能发现更多问题。

你会怎么选?

你的代码要上线了,代码审查员发现一个性能问题,测试工程师发现测试覆盖率只有 40%,安全审计员发现一个 SQL 注入漏洞。你应该先修哪个?

📚
记住这个优先级

安全问题 > 功能正确性 > 测试覆盖 > 性能优化 > 代码美观。安全漏洞是"着火了",性能问题是"灯不够亮"——你会先灭火还是先换灯泡?

05

你的第一个实战项目

跟踪"用户登录功能"从想法到上线的完整旅程

跟踪一个真实功能从想法到上线

你有一个想法:给 App 加一个用户登录功能。看起来很简单对吧?但在真实项目中,一个"简单"的登录功能背后要经过多少道关卡?让我们看看 Agent Skills 如何帮你从零到上线。

1
你告诉 AI:"我想加一个用户登录功能"

这就是起点——一个模糊的想法。

2
idea-refine 激活

AI 问你澄清问题:"支持哪些登录方式?忘记密码怎么处理?需要手机号登录吗?"

3
spec-driven-development 激活

AI 帮你写一份完整的需求文档——目标是什么、用户故事是什么、边界在哪里。

4
planning-and-task-breakdown 激活

AI 把需求拆成 5 个任务:数据库设计、注册接口、登录接口、忘记密码、前端表单。

5
incremental-implementation 激活

AI 一个任务一个任务地写代码,每完成一个就验证一个,绝不一口气全写完。

6
test-driven-development 激活

每写一段代码前先写测试。"注册时邮箱格式不对应该报错"——测试先写,代码跟上。

7
debugging-and-error-recovery 激活

发现 bug?不慌。系统化排查:复现问题 → 定位原因 → 修复 → 验证。不做"试试看"式的瞎改。

8
code-review-and-quality 激活

五维度审查代码:正确性、可读性、可维护性、性能、一致性。像资深同事帮你 review。

9
security-and-hardening 激活

检查 SQL 注入XSS、密码加密、会话管理——安全无小事。

10
shipping-and-launch 激活

部署上线:先上测试环境确认,再推生产环境,最后监控运行状态。完美收工。

💡
注意到什么了吗?

从第 1 步到第 10 步,没有一步是"跳过"的。每个阶段都有专门的技能负责,每个成果物都经过验证后才传递给下一步。这就是 Agent Skills 的力量——不是让你更快地写代码,而是让你每一步都走稳

Spec 长什么样?

还记得 Module 2 里介绍的 Spec 格式吗?下面是一个真实的"用户登录功能"Spec,左边是 AI 看到的格式,右边是每一条的中文解释。

SPEC FILE ## Objective 用户登录功能,支持邮箱+密码注册和登录。   ## Commands npm test # 运行所有测试 npm run dev # 启动开发服务器 npm run build # 构建生产版本   ## Boundaries - Always: 密码用 bcrypt 加密存储 - Always: 所有 API 输入必须验证 - Never: 不存储明文密码 - Never: 不在日志中打印密码
中文翻译
目标:用户可以用邮箱和密码注册、登录。
命令:测试代码、启动服务器、打包发布的具体命令。AI 每次操作前都会看这些命令,确保用的是正确的方式。
边界——必须做:密码加密存储、所有输入验证。这些是铁律,AI 不能跳过。
边界——绝对不做:不存明文密码、不在日志里泄露密码。违反这些就是安全事故。
📚
为什么 Boundaries 这么重要?

Boundaries 就是给 AI 划红线。"必须做"的事情 AI 每一步都会检查,"绝对不做"的事情 AI 碰都不会碰。没有 Boundaries,AI 可能为图方便把密码明文存在数据库里——这不是 AI 坏,是没人告诉它规矩。

你需要记住的最重要的三件事

💡
Agent Skills 的三条核心理念

1. 先想清楚再动手 — 写代码前先写需求文档和计划。就像盖房子先画图纸,不画图纸直接砌墙,盖到一半发现忘了留门。

2. 每一步都有验证 — 测试驱动、代码审查、安全检查。就像工厂流水线的质检站,每个零件出厂前都要检测。

3. 做减法不做加法 — 用最少的代码解决问题,发现复杂代码就简化。代码越少,bug 越少,维护越容易。

📌
下一步你可以做什么?

在 Claude Code 中安装 Agent Skills,用 /spec 开始你的第一个项目。

在 Cursor 中把 skills/ 文件夹复制到 .cursor/rules/ 目录下。

在 Gemini CLI 中使用内置的技能支持。

GitHub 仓库:github.com/addyosmani/agent-skills

最终测验

情景模拟

你是一个独立开发者,用 AI 助手开发一个电商网站。你刚写完购物车功能的代码,接下来要做什么?

购物车代码写完后,第一步应该?

AI 助手建议"先跳过错误处理,功能做完再加"。你应该?

🎉
恭喜你完成了全部课程!

你现在已经了解了 Agent Skills 的核心概念:六阶段流水线、21 个技能的分工、三位专家代理人的协作方式,以及如何跟踪一个真实功能从想法到上线。接下来,打开你的 AI 编程工具,用 Agent Skills 开始你的第一个项目吧。记住:先想清楚再动手,每一步都有验证,做减法不做加法。祝你写出高质量的代码!