在线咨询

专属客服在线解答，提供专业解决方案

声网 AI 助手

您的专属 AI 伙伴，开启全新搜索体验

首页博客正文

什么是 Agent Skills？为什么 2026 年突然爆火（上）

2026-02-13

暮木君

AI 情报局

Agent Skills 可以理解为“给 AI 看的可执行入职手册”：用一个包含 SKILL.md 的文件夹，把流程、脚本、模板、参考资料打包成可复用、可版本化、可按需加载的“技能”。它在 2026 年突然出圈的核心原因是：主流 coding agent 纷纷支持同一套开放标准、技能分发（CLI/排行榜/市场）开始成熟、以及“工具连接（MCP）+流程封装（Skills）”成为企业落地最短路径。

本文从标准起源、平台差异、执行环境与权限、工程治理、安全供应链、生态商业到未来合规趋势做一次开发者向“长文拆解”。

什么是Agent Skills

1 概念与起源

Agent Skills 不是 prompt，也不是插件市场的另一个马甲；它更像你写给新同事的 onboarding 文档，但这位“同事”会读文件、会跑脚本、还会在你不注意时把你的上下文窗口吃到爆。

1.1 Agent Skills 的最小定义

Agent Skills 的开放标准给出的最小单元非常朴素：一个技能就是一个目录，至少包含一个 SKILL.md 文件；SKILL.md 由 YAML frontmatter（至少 name、description）+ Markdown 正文组成；并可选配套 scripts/、references/、assets/ 等目录。

标准还明确了它的“按需加载”理念（progressive disclosure）：启动时只加载所有技能的元数据；真正触发技能时再加载 SKILL.md 正文；其它脚本/参考资料按需再读，建议通过相对路径引用且不要形成深层“套娃式”引用链。

更关键的一句是：这个格式最初由 Anthropic 开发并开放出来，目标就是跨平台可移植。

1.2 平台实现差异一览

下面这张表是“开发者最关心的差异点”：格式是不是同一套、权限/执行环境怎么管、怎么集成、适合干什么。

平台	支持格式/发现机制	权限模型与执行环境（公开信息）	集成方式（面向开发者）	主要场景
OpenAI	以 `SKILL.md` 为核心；强调 progressive disclosure；Codex 会先加载 `name/description/path` 等元信息，必要时再读正文；支持多层级扫描与安装器/创建器	既支持本地（CLI）也支持托管；在 API 场景里，服务会把技能包拷贝进执行环境并通过 shell 工具执行（容器或本地）	Codex：CLI/IDE/App 均可用；API：`POST /v1/skills` 上传并版本化，运行时通过 `tools[].environment.skills` 引用	编码工作流、可复用程序化流程、脚本化数据处理
Anthropic	以 `SKILL.md` 文件夹为核心；提供预置技能（文档类）+自定义技能；同样强调按需加载	Claude 在带文件系统访问的虚拟机/容器环境中运行技能；API 使用技能需要 code execution 容器与 beta header；（更细的权限管控依产品/配置而定）	Claude.ai/Claude Code 上传或本地目录；API 通过技能 ID 使用；Agent SDK 可从 `.claude/skills/` 自动发现	文档自动化（pptx/xlsx/docx/pdf）、企业流程与知识封装、与工具连接协同
GitHub	明确宣称 Agent Skills 是开放标准；支持 repo 级与个人级技能目录；按 `description` 决定何时注入 `SKILL.md`	coding agent 形态被描述为会启动 VM、clone 仓库并执行任务；但对技能脚本的权限细节与隔离边界多为“未完全公开/依产品形态变化”	`.github/skills` 或 `.claude/skills`（项目级），`~/.copilot/skills` 或 `~/.claude/skills`（个人级）；支持 Copilot CLI、VS Code agent mode 等	仓库工作流（CI 失败排查、PR 自动化）、终端/IDE 场景的可复用流程
Cursor	以 `SKILL.md` 定义动态能力；强调“规则（Rules）= 永久在线文、技能（Skills）= 按需加载”	强调 hooks/脚本可在本机环境参与 agent 流程；对隔离/权限属于“工具侧能力+用户环境”组合，需自行治理	项目/全局技能目录（社区指引）；支持 `/.` 命令触发与 hooks JSON 配置；并强调可接 MCP 扩展外部系统	IDE 里的长任务、可验证循环（跑测试直到通过）、把团队习惯固化成命令/钩子

表中信息汇总自各平台官方文档/工程博客与更新日志。

2 为什么 2026 年突然爆火

如果把 2023–2025 看作“Agent 学会用工具的青春期”，那 2026 就是它突然“找到工作并开始写周报”的一年：工具连接标准化 + 流程知识模块化 + 分发机制产品化，三件事在同一时间点对齐了。

2.1 关键事件时间线

Agent Skills 关键事件时间线

2.2 “突然爆火”的三条更底层原因

Agent 终于变成了“能干活的进程”，而不是“会聊天的函数”。Cursor 官方的工程博客直接写到：模型可以跑数小时、做跨文件重构、迭代直到测试通过。这类长任务天然需要“套路化流程”和“对象级资源”（脚本、模板、清单），否则你只能每天把同一段 prompt 当经文背诵。
开放标准形成跨平台网络效应。一旦 SKILL.md 这种“极简文件夹协议”被多平台采纳，团队就会自然把它当作新的“可移植知识载体”。Anthropic 在 skills 标准站点明确提到：技能的价值之一就是“写一次，到处用”。
分发层开始产品化，技能从“贴教程”升级为“可安装组件”。Vercel 在 2026-01 发布 skills CLI，并同步推出 skills.sh 用于发现、排行与统计；这让技能第一次具备了“安装、更新、传播”的工具链外壳。

3 技术细节：技能包结构、接口权限与 MCP 的关系

这一节我们把 Agent Skills 拆成三层：格式层（怎么写）→执行层（怎么跑）→连接层（怎么接外部系统）。

3.1 格式层：SKILL.md 的“契约”比正文更重要

开放规范要求 SKILL.md 必须以 YAML frontmatter 开头，至少包含 name 与 description，并给出了约束：name 必须与目录名一致、且只允许小写字母/数字/连字符；description 需要描述“做什么 + 什么时候用”，甚至建议塞关键词帮助路由匹配。

规范也提供了一些面向工程化的可选字段：

license：声明技能的许可；
compatibility：声明环境需求（例如需要 git/docker/jq 或需要联网）；
metadata：自定义键值；
allowed-tools：预批准可调用工具列表（实验性，支持程度因实现而异）。

此外，规范给出了 progressive disclosure 的建议 token 预算：元数据约 100 tokens、SKILL.md 正文建议 <5000 tokens、其它资源按需加载。

3.2 执行层：不同平台“怎么跑技能”

OpenAI 的 Codex 文档把技能当作“任务级能力包”：Codex 起步只加载元数据（含可选 agents/openai.yaml 的额外元信息），决定使用时再加载 SKILL.md；触发方式包含显式调用（例如 CLI/IDE 里提到技能）与隐式匹配（命中 description）。

更重要的是它的“发现与治理”：Codex 会在仓库层级扫描 .agents/skills，并额外支持用户级 $HOME/.agents/skills、管理员级 /etc/codex/skills、以及系统内置技能；还支持安装器 $skill-installer、创建器 $skill-creator，并可在 ~/.codex/config.toml 里禁用指定技能（应急回滚非常实用）。

OpenAI 在 API 场景的 Cookbook 更明确：技能包会被复制进执行环境；服务先读取 frontmatter 并把 name/description/path 放入隐藏系统上下文；模型决定调用时再读 SKILL.md 并通过 shell 工具执行脚本。这里还给出了“托管容器 vs 本地 shell”的选择（environment.type=”container_auto” 或 local），以及通过 skill_reference 引用特定版本的机制。
Anthropic 的官方文档同样强调技能基于“文件系统 + 代码执行环境”：Claude 在带文件系统访问的虚拟机环境里运行技能，支持 progressive disclosure，并在 API 场景中要求开启 code execution 容器以及多个 beta header；自定义技能可通过 Claude Code 创建、通过 API 上传、或在 claude.ai 设置里上传（但“个人上传”与“组织共享”能力存在差异）。
GitHub 文档给出很明确的目录与加载方式：项目级技能可放在 .github/skills 或 .claude/skills；个人技能在 ~/.copilot/skills 或 ~/.claude/skills；Copilot 会根据 prompt 与技能 description 决定是否注入 SKILL.md 到上下文，并可使用技能目录内的脚本与资源。
Cursor 的工程博客则把技能视作“动态能力/工作流”：与永久在线文的 Rules 相对，Skills 是 agent 决定需要时才加载；并可包含自定义命令、hooks（在 agent 行为前后运行脚本）与领域知识；同时提到技能目前在 Nightly 渠道提供，并建议把一些循环工作自动化（例如通过 hook 让 agent 持续迭代直到测试通过）。

3.3 连接层：Skills 与 MCP 是什么关系

MCP 解决“能不能接到工具和数据”，Skills 解决“接到了以后怎么用得像个专业人士”。

MCP（Model Context Protocol）由 Anthropic 提出，是一个让 LLM 应用与外部数据源和工具“无缝连接”的开放协议：你可以暴露 MCP server（提供工具/数据），也可以构建 MCP client（在 agent/应用侧调用这些工具）。

关于MCP的文章，请查看过往文章：

《MCP详解一：什么是MCP？一文读懂模型上下文协议》

《MCP详解二：MCP工作原理—像搭积木一样理解AI工具连接》

《MCP 服务端推荐：开发者工具精选》

技能与 MCP 的结合点在多个官方材料中被反复提到：

Anthropic 的技能指南在引言就强调：对于构建 MCP 集成的人来说，技能可以把“裸工具访问”变成可靠、优化过的工作流。
GitHub 的技能示例甚至直接要求“使用 GitHub MCP Server 提供的工具”来排查 CI 问题（比如列出 workflow run、总结日志失败点等）。
Cursor 的博客也把 MCP 放在“Beyond coding”的位置：用 MCP 让 agent 读 Slack、查 Datadog、看 Sentry、查数据库等。

所以更工程化的理解是：

MCP 是工具面（capability surface）：工具名、参数、鉴权、返回值协议。
Skills 是流程面（procedure layer）：触发条件、步骤编排、失败回滚、输出格式、以及“什么时候别乱用工具”。

下一篇我们将探讨Agent Skills 的工程化落地、实操实践、安全治理及生态合规趋势，具体请阅读《什么是 Agent Skills？为什么 2026 年突然爆火（下）》（即将上线）。

在声网，连接无限可能

想进一步了解「对话式 AI 与实时互动」？欢迎注册，开启探索之旅。

注册体验

本博客为技术交流与平台行业信息分享平台，内容仅供交流参考，文章内容不代表本公司立场和观点，亦不构成任何出版或销售行为。