Agent Skills 可以理解为“给 AI 看的可执行入职手册”:用一个包含 SKILL.md 的文件夹,把流程、脚本、模板、参考资料打包成可复用、可版本化、可按需加载的“技能”。它在 2026 年突然出圈的核心原因是:主流 coding agent 纷纷支持同一套开放标准、技能分发(CLI/排行榜/市场)开始成熟、以及“工具连接(MCP)+流程封装(Skills)”成为企业落地最短路径。
本文从标准起源、平台差异、执行环境与权限、工程治理、安全供应链、生态商业到未来合规趋势做一次开发者向“长文拆解”。

1 概念与起源
Agent Skills 不是 prompt,也不是插件市场的另一个马甲;它更像你写给新同事的 onboarding 文档,但这位“同事”会读文件、会跑脚本、还会在你不注意时把你的上下文窗口吃到爆。
1.1 Agent Skills 的最小定义
Agent Skills 的开放标准给出的最小单元非常朴素:一个技能就是一个目录,至少包含一个 SKILL.md 文件;SKILL.md 由 YAML frontmatter(至少 name、description)+ Markdown 正文组成;并可选配套 scripts/、references/、assets/ 等目录。
标准还明确了它的“按需加载”理念(progressive disclosure):启动时只加载所有技能的元数据;真正触发技能时再加载 SKILL.md 正文;其它脚本/参考资料按需再读,建议通过相对路径引用且不要形成深层“套娃式”引用链。
更关键的一句是:这个格式最初由 Anthropic 开发并开放出来,目标就是跨平台可移植。
1.2 平台实现差异一览
下面这张表是“开发者最关心的差异点”:格式是不是同一套、权限/执行环境怎么管、怎么集成、适合干什么。
| 平台 | 支持格式/发现机制 | 权限模型与执行环境(公开信息) | 集成方式(面向开发者) | 主要场景 |
|---|---|---|---|---|
| OpenAI | 以 SKILL.md 为核心;强调 progressive disclosure;Codex 会先加载 name/description/path 等元信息,必要时再读正文;支持多层级扫描与安装器/创建器 |
既支持本地(CLI)也支持托管;在 API 场景里,服务会把技能包拷贝进执行环境并通过 shell 工具执行(容器或本地) | Codex:CLI/IDE/App 均可用;API:POST /v1/skills 上传并版本化,运行时通过 tools[].environment.skills 引用 |
编码工作流、可复用程序化流程、脚本化数据处理 |
| Anthropic | 以 SKILL.md 文件夹为核心;提供预置技能(文档类)+自定义技能;同样强调按需加载 |
Claude 在带文件系统访问的虚拟机/容器环境中运行技能;API 使用技能需要 code execution 容器与 beta header;(更细的权限管控依产品/配置而定) | Claude.ai/Claude Code 上传或本地目录;API 通过技能 ID 使用;Agent SDK 可从 .claude/skills/ 自动发现 |
文档自动化(pptx/xlsx/docx/pdf)、企业流程与知识封装、与工具连接协同 |
| GitHub | 明确宣称 Agent Skills 是开放标准;支持 repo 级与个人级技能目录;按 description 决定何时注入 SKILL.md |
coding agent 形态被描述为会启动 VM、clone 仓库并执行任务;但对技能脚本的权限细节与隔离边界多为“未完全公开/依产品形态变化” | .github/skills 或 .claude/skills(项目级),~/.copilot/skills 或 ~/.claude/skills(个人级);支持 Copilot CLI、VS Code agent mode 等 |
仓库工作流(CI 失败排查、PR 自动化)、终端/IDE 场景的可复用流程 |
| Cursor | 以 SKILL.md 定义动态能力;强调“规则(Rules)= 永久在线文、技能(Skills)= 按需加载” |
强调 hooks/脚本可在本机环境参与 agent 流程;对隔离/权限属于“工具侧能力+用户环境”组合,需自行治理 | 项目/全局技能目录(社区指引);支持 /. 命令触发与 hooks JSON 配置;并强调可接 MCP 扩展外部系统 |
IDE 里的长任务、可验证循环(跑测试直到通过)、把团队习惯固化成命令/钩子 |
表中信息汇总自各平台官方文档/工程博客与更新日志。
2 为什么 2026 年突然爆火
如果把 2023–2025 看作“Agent 学会用工具的青春期”,那 2026 就是它突然“找到工作并开始写周报”的一年:工具连接标准化 + 流程知识模块化 + 分发机制产品化,三件事在同一时间点对齐了。
2.1 关键事件时间线

2.2 “突然爆火”的三条更底层原因
- Agent 终于变成了“能干活的进程”,而不是“会聊天的函数”。Cursor 官方的工程博客直接写到:模型可以跑数小时、做跨文件重构、迭代直到测试通过。这类长任务天然需要“套路化流程”和“对象级资源”(脚本、模板、清单),否则你只能每天把同一段 prompt 当经文背诵。
- 开放标准形成跨平台网络效应。一旦 SKILL.md 这种“极简文件夹协议”被多平台采纳,团队就会自然把它当作新的“可移植知识载体”。Anthropic 在 skills 标准站点明确提到:技能的价值之一就是“写一次,到处用”。
- 分发层开始产品化,技能从“贴教程”升级为“可安装组件”。Vercel 在 2026-01 发布 skills CLI,并同步推出 skills.sh 用于发现、排行与统计;这让技能第一次具备了“安装、更新、传播”的工具链外壳。
3 技术细节:技能包结构、接口权限与 MCP 的关系
这一节我们把 Agent Skills 拆成三层:格式层(怎么写)→执行层(怎么跑)→连接层(怎么接外部系统)。
3.1 格式层:SKILL.md 的“契约”比正文更重要
开放规范要求 SKILL.md 必须以 YAML frontmatter 开头,至少包含 name 与 description,并给出了约束:name 必须与目录名一致、且只允许小写字母/数字/连字符;description 需要描述“做什么 + 什么时候用”,甚至建议塞关键词帮助路由匹配。
规范也提供了一些面向工程化的可选字段:
- license:声明技能的许可;
- compatibility:声明环境需求(例如需要 git/docker/jq 或需要联网);
- metadata:自定义键值;
- allowed-tools:预批准可调用工具列表(实验性,支持程度因实现而异)。
此外,规范给出了 progressive disclosure 的建议 token 预算:元数据约 100 tokens、SKILL.md 正文建议 <5000 tokens、其它资源按需加载。
3.2 执行层:不同平台“怎么跑技能”
OpenAI 的 Codex 文档把技能当作“任务级能力包”:Codex 起步只加载元数据(含可选 agents/openai.yaml 的额外元信息),决定使用时再加载 SKILL.md;触发方式包含显式调用(例如 CLI/IDE 里提到技能)与隐式匹配(命中 description)。
更重要的是它的“发现与治理”:Codex 会在仓库层级扫描 .agents/skills,并额外支持用户级 $HOME/.agents/skills、管理员级 /etc/codex/skills、以及系统内置技能;还支持安装器 $skill-installer、创建器 $skill-creator,并可在 ~/.codex/config.toml 里禁用指定技能(应急回滚非常实用)。
- OpenAI 在 API 场景的 Cookbook 更明确:技能包会被复制进执行环境;服务先读取 frontmatter 并把 name/description/path 放入隐藏系统上下文;模型决定调用时再读 SKILL.md 并通过 shell 工具执行脚本。这里还给出了“托管容器 vs 本地 shell”的选择(environment.type=”container_auto” 或 local),以及通过 skill_reference 引用特定版本的机制。
- Anthropic 的官方文档同样强调技能基于“文件系统 + 代码执行环境”:Claude 在带文件系统访问的虚拟机环境里运行技能,支持 progressive disclosure,并在 API 场景中要求开启 code execution 容器以及多个 beta header;自定义技能可通过 Claude Code 创建、通过 API 上传、或在 claude.ai 设置里上传(但“个人上传”与“组织共享”能力存在差异)。
- GitHub 文档给出很明确的目录与加载方式:项目级技能可放在 .github/skills 或 .claude/skills;个人技能在 ~/.copilot/skills 或 ~/.claude/skills;Copilot 会根据 prompt 与技能 description 决定是否注入 SKILL.md 到上下文,并可使用技能目录内的脚本与资源。
- Cursor 的工程博客则把技能视作“动态能力/工作流”:与永久在线文的 Rules 相对,Skills 是 agent 决定需要时才加载;并可包含自定义命令、hooks(在 agent 行为前后运行脚本)与领域知识;同时提到技能目前在 Nightly 渠道提供,并建议把一些循环工作自动化(例如通过 hook 让 agent 持续迭代直到测试通过)。
3.3 连接层:Skills 与 MCP 是什么关系
MCP 解决“能不能接到工具和数据”,Skills 解决“接到了以后怎么用得像个专业人士”。
MCP(Model Context Protocol)由 Anthropic 提出,是一个让 LLM 应用与外部数据源和工具“无缝连接”的开放协议:你可以暴露 MCP server(提供工具/数据),也可以构建 MCP client(在 agent/应用侧调用这些工具)。
技能与 MCP 的结合点在多个官方材料中被反复提到:
- Anthropic 的技能指南在引言就强调:对于构建 MCP 集成的人来说,技能可以把“裸工具访问”变成可靠、优化过的工作流。
- GitHub 的技能示例甚至直接要求“使用 GitHub MCP Server 提供的工具”来排查 CI 问题(比如列出 workflow run、总结日志失败点等)。
- Cursor 的博客也把 MCP 放在“Beyond coding”的位置:用 MCP 让 agent 读 Slack、查 Datadog、看 Sentry、查数据库等。
所以更工程化的理解是:
- MCP 是工具面(capability surface):工具名、参数、鉴权、返回值协议。
- Skills 是流程面(procedure layer):触发条件、步骤编排、失败回滚、输出格式、以及“什么时候别乱用工具”。
下一篇我们将探讨Agent Skills 的工程化落地、实操实践、安全治理及生态合规趋势,具体请阅读《什么是 Agent Skills?为什么 2026 年突然爆火(下)》(即将上线)。