在线咨询
专属客服在线解答,提供专业解决方案
声网 AI 助手
您的专属 AI 伙伴,开启全新搜索体验

什么是 Agent Skills?为什么 2026 年突然爆火(上)

Agent Skills 可以理解为“给 AI 看的可执行入职手册”:用一个包含 SKILL.md 的文件夹,把流程、脚本、模板、参考资料打包成可复用、可版本化、可按需加载的“技能”。它在 2026 年突然出圈的核心原因是:主流 coding agent 纷纷支持同一套开放标准、技能分发(CLI/排行榜/市场)开始成熟、以及“工具连接(MCP)+流程封装(Skills)”成为企业落地最短路径。

本文从标准起源、平台差异、执行环境与权限、工程治理、安全供应链、生态商业到未来合规趋势做一次开发者向“长文拆解”。

什么是Agent Skills

 

1 概念与起源

Agent Skills 不是 prompt,也不是插件市场的另一个马甲;它更像你写给新同事的 onboarding 文档,但这位“同事”会读文件、会跑脚本、还会在你不注意时把你的上下文窗口吃到爆。

1.1 Agent Skills 的最小定义

Agent Skills 的开放标准给出的最小单元非常朴素:一个技能就是一个目录,至少包含一个 SKILL.md 文件;SKILL.md 由 YAML frontmatter(至少 name、description)+ Markdown 正文组成;并可选配套 scripts/、references/、assets/ 等目录。

标准还明确了它的“按需加载”理念(progressive disclosure):启动时只加载所有技能的元数据;真正触发技能时再加载 SKILL.md 正文;其它脚本/参考资料按需再读,建议通过相对路径引用且不要形成深层“套娃式”引用链。

更关键的一句是:这个格式最初由 Anthropic 开发并开放出来,目标就是跨平台可移植。

1.2 平台实现差异一览

下面这张表是“开发者最关心的差异点”:格式是不是同一套、权限/执行环境怎么管、怎么集成、适合干什么。

平台 支持格式/发现机制 权限模型与执行环境(公开信息) 集成方式(面向开发者) 主要场景
OpenAI 以 SKILL.md 为核心;强调 progressive disclosure;Codex 会先加载 name/description/path 等元信息,必要时再读正文;支持多层级扫描与安装器/创建器 既支持本地(CLI)也支持托管;在 API 场景里,服务会把技能包拷贝进执行环境并通过 shell 工具执行(容器或本地) Codex:CLI/IDE/App 均可用;API:POST /v1/skills 上传并版本化,运行时通过 tools[].environment.skills 引用 编码工作流、可复用程序化流程、脚本化数据处理
Anthropic 以 SKILL.md 文件夹为核心;提供预置技能(文档类)+自定义技能;同样强调按需加载 Claude 在带文件系统访问的虚拟机/容器环境中运行技能;API 使用技能需要 code execution 容器与 beta header;(更细的权限管控依产品/配置而定) Claude.ai/Claude Code 上传或本地目录;API 通过技能 ID 使用;Agent SDK 可从 .claude/skills/ 自动发现 文档自动化(pptx/xlsx/docx/pdf)、企业流程与知识封装、与工具连接协同
GitHub 明确宣称 Agent Skills 是开放标准;支持 repo 级与个人级技能目录;按 description 决定何时注入 SKILL.md coding agent 形态被描述为会启动 VM、clone 仓库并执行任务;但对技能脚本的权限细节与隔离边界多为“未完全公开/依产品形态变化” .github/skills 或 .claude/skills(项目级),~/.copilot/skills 或 ~/.claude/skills(个人级);支持 Copilot CLI、VS Code agent mode 等 仓库工作流(CI 失败排查、PR 自动化)、终端/IDE 场景的可复用流程
Cursor 以 SKILL.md 定义动态能力;强调“规则(Rules)= 永久在线文、技能(Skills)= 按需加载” 强调 hooks/脚本可在本机环境参与 agent 流程;对隔离/权限属于“工具侧能力+用户环境”组合,需自行治理 项目/全局技能目录(社区指引);支持 /. 命令触发与 hooks JSON 配置;并强调可接 MCP 扩展外部系统 IDE 里的长任务、可验证循环(跑测试直到通过)、把团队习惯固化成命令/钩子

表中信息汇总自各平台官方文档/工程博客与更新日志。

 

2 为什么 2026 年突然爆火

如果把 2023–2025 看作“Agent 学会用工具的青春期”,那 2026 就是它突然“找到工作并开始写周报”的一年:工具连接标准化 + 流程知识模块化 + 分发机制产品化,三件事在同一时间点对齐了。

2.1 关键事件时间线

Agent Skills 关键事件时间线

2.2 “突然爆火”的三条更底层原因

  1. Agent 终于变成了“能干活的进程”,而不是“会聊天的函数”。Cursor 官方的工程博客直接写到:模型可以跑数小时、做跨文件重构、迭代直到测试通过。这类长任务天然需要“套路化流程”和“对象级资源”(脚本、模板、清单),否则你只能每天把同一段 prompt 当经文背诵。
  2. 开放标准形成跨平台网络效应。一旦 SKILL.md 这种“极简文件夹协议”被多平台采纳,团队就会自然把它当作新的“可移植知识载体”。Anthropic 在 skills 标准站点明确提到:技能的价值之一就是“写一次,到处用”。
  3. 分发层开始产品化,技能从“贴教程”升级为“可安装组件”。Vercel 在 2026-01 发布 skills CLI,并同步推出 skills.sh 用于发现、排行与统计;这让技能第一次具备了“安装、更新、传播”的工具链外壳。

 

3 技术细节:技能包结构、接口权限与 MCP 的关系

这一节我们把 Agent Skills 拆成三层:格式层(怎么写)→执行层(怎么跑)→连接层(怎么接外部系统)。

3.1 格式层:SKILL.md 的“契约”比正文更重要

开放规范要求 SKILL.md 必须以 YAML frontmatter 开头,至少包含 name 与 description,并给出了约束:name 必须与目录名一致、且只允许小写字母/数字/连字符;description 需要描述“做什么 + 什么时候用”,甚至建议塞关键词帮助路由匹配。

规范也提供了一些面向工程化的可选字段:

  • license:声明技能的许可;
  • compatibility:声明环境需求(例如需要 git/docker/jq 或需要联网);
  • metadata:自定义键值;
  • allowed-tools:预批准可调用工具列表(实验性,支持程度因实现而异)。

此外,规范给出了 progressive disclosure 的建议 token 预算:元数据约 100 tokens、SKILL.md 正文建议 <5000 tokens、其它资源按需加载。

3.2 执行层:不同平台“怎么跑技能”

OpenAI 的 Codex 文档把技能当作“任务级能力包”:Codex 起步只加载元数据(含可选 agents/openai.yaml 的额外元信息),决定使用时再加载 SKILL.md;触发方式包含显式调用(例如 CLI/IDE 里提到技能)与隐式匹配(命中 description)。

更重要的是它的“发现与治理”:Codex 会在仓库层级扫描 .agents/skills,并额外支持用户级 $HOME/.agents/skills、管理员级 /etc/codex/skills、以及系统内置技能;还支持安装器 $skill-installer、创建器 $skill-creator,并可在 ~/.codex/config.toml 里禁用指定技能(应急回滚非常实用)。

  • OpenAI 在 API 场景的 Cookbook 更明确:技能包会被复制进执行环境;服务先读取 frontmatter 并把 name/description/path 放入隐藏系统上下文;模型决定调用时再读 SKILL.md 并通过 shell 工具执行脚本。这里还给出了“托管容器 vs 本地 shell”的选择(environment.type=”container_auto” 或 local),以及通过 skill_reference 引用特定版本的机制。
  • Anthropic 的官方文档同样强调技能基于“文件系统 + 代码执行环境”:Claude 在带文件系统访问的虚拟机环境里运行技能,支持 progressive disclosure,并在 API 场景中要求开启 code execution 容器以及多个 beta header;自定义技能可通过 Claude Code 创建、通过 API 上传、或在 claude.ai 设置里上传(但“个人上传”与“组织共享”能力存在差异)。
  • GitHub 文档给出很明确的目录与加载方式:项目级技能可放在 .github/skills 或 .claude/skills;个人技能在 ~/.copilot/skills 或 ~/.claude/skills;Copilot 会根据 prompt 与技能 description 决定是否注入 SKILL.md 到上下文,并可使用技能目录内的脚本与资源。
  • Cursor 的工程博客则把技能视作“动态能力/工作流”:与永久在线文的 Rules 相对,Skills 是 agent 决定需要时才加载;并可包含自定义命令、hooks(在 agent 行为前后运行脚本)与领域知识;同时提到技能目前在 Nightly 渠道提供,并建议把一些循环工作自动化(例如通过 hook 让 agent 持续迭代直到测试通过)。

3.3 连接层:Skills 与 MCP 是什么关系

MCP 解决“能不能接到工具和数据”,Skills 解决“接到了以后怎么用得像个专业人士”。

MCP(Model Context Protocol)由 Anthropic 提出,是一个让 LLM 应用与外部数据源和工具“无缝连接”的开放协议:你可以暴露 MCP server(提供工具/数据),也可以构建 MCP client(在 agent/应用侧调用这些工具)。

 

技能与 MCP 的结合点在多个官方材料中被反复提到:

  • Anthropic 的技能指南在引言就强调:对于构建 MCP 集成的人来说,技能可以把“裸工具访问”变成可靠、优化过的工作流。
  • GitHub 的技能示例甚至直接要求“使用 GitHub MCP Server 提供的工具”来排查 CI 问题(比如列出 workflow run、总结日志失败点等)。
  • Cursor 的博客也把 MCP 放在“Beyond coding”的位置:用 MCP 让 agent 读 Slack、查 Datadog、看 Sentry、查数据库等。

所以更工程化的理解是:

  • MCP 是工具面(capability surface):工具名、参数、鉴权、返回值协议。
  • Skills 是流程面(procedure layer):触发条件、步骤编排、失败回滚、输出格式、以及“什么时候别乱用工具”。

下一篇我们将探讨Agent Skills 的工程化落地、实操实践、安全治理及生态合规趋势,具体请阅读《什么是 Agent Skills?为什么 2026 年突然爆火(下)》(即将上线)。

在声网,连接无限可能

想进一步了解「对话式 AI 与 实时互动」?欢迎注册,开启探索之旅。

本博客为技术交流与平台行业信息分享平台,内容仅供交流参考,文章内容不代表本公司立场和观点,亦不构成任何出版或销售行为。