上一篇我们围绕 Agent Skills 明确其核心定位,本质是包含 SKILL.md 文件的文件夹,可将流程、脚本等资源打包为可复用、可版本化、可按需加载的“技能”,且该格式由 Anthropic 开发并开放,核心目标是跨平台可移植。最后深入拆解技术细节,将 Agent Skills 分为三层:拆解了格式层、执行层和连接层的技术细节。本篇将深入探讨Agent Skills 的工程化落地、实操实践、安全治理及生态合规趋势。
3 技术细节:技能包结构、接口权限与 MCP 的关系
3.4 开发者实操示例一:一个跨平台可复用的 “Code Review + 自检” 技能
这个示例遵循 Agent Skills 标准目录结构(SKILL.md + scripts/ + references/),尽量让它能在多个技能兼容平台迁移;你可以把它放进不同平台的“项目级技能目录”里(例如 .agents/skills/、.claude/skills/、.github/skills/、.cursor/skills/ 等),具体发现路径以平台实现为准。
目录结构:
text
code-review/
SKILL.md
scripts/
review.sh
references/
checklist.md
SKILL.md(可直接复制):
markdown
---
name: code-review
description: 对代码改动做结构化评审与自检。仅在用户要求“review/代码评审/PR 检查/重构建议”或给出 diff/PR 链接时触发。不要在无代码上下文的闲聊里触发。
compatibility: Requires git and a shell tool. Network access optional.
allowed-tools: Bash(git:*) Read
metadata:
owner: platform-team
version: "1.0.0"
---
# Code Review Skill
## Output contract
- 先给结论:Risk(Low/Med/High)+ 需要立即修的 Top 3
- 再按类别展开:Correctness / Security / Performance / Observability / DX
- 最后给“可执行下一步”:具体命令、具体文件、建议的测试用例
## Workflow
1. 获取变化范围:优先 `git diff --stat` + `git diff`(如不可用则读取用户提供的 diff)
2. 运行快速静态检查(若项目有脚本/命令在 references/ 里说明):lint/typecheck/test(能跑就跑,跑不了就解释原因)
3. 按 references/checklist.md 的清单逐条检查
4. 遇到不确定就提问(不要编造项目约束)
5. 给出最小修改建议:能用补丁/小 diff 解决就别写长论文
scripts/review.sh(示例脚本骨架):
bash
#!/usr/bin/env bash
set -euo pipefail
echo "[1/3] Diff stat"
git diff --stat || true
echo "[2/3] Run quick checks (if available)"
if [ -f package.json ]; then
npm -s test || true
fi
echo "[3/3] Done. Return findings in structured format."
关键实现要点与注意事项:
- description 要写清“何时触发/何时不触发”,因为多数实现都会依赖它做隐式路由。
- allowed-tools 在标准里是实验性字段,不是每个平台都严格执行;不要把它当“绝对沙箱”。
- 引用其它文件时用相对路径,并尽量保持一层深度,避免 agent 拉一长串文件把上下文窗口撑爆。工程化实践:目录、CI/CD、版本治理、签名校验与回滚
4 工程化实践:目录、CI/CD、版本治理、签名校验与回滚
4.1 目录与版本:把技能当“可发布制品”管理
首先,标准已经为你准备了最基本的治理字段:license(许可)、metadata(可放版本号/作者/渠道)、compatibility(环境依赖),并提供验证工具建议。
其次,平台侧也开始支持“版本化引用”:
- OpenAI API 的技能上传返回版本指针(default/latest),并允许你在运行时引用指定版本;这天然适配灰度发布和回滚。
- Codex CLI 侧可通过配置禁用技能(按路径),这就是最直接的“紧急熔断”。
4.2 分发:从“复制文件夹”到“一条命令安装”
2026 年初,分发层的进展是让技能爆火的关键推力之一:Vercel 发布 skills CLI(npx skills add )并同步 skills.sh 做目录与排行榜;其文案明确了一个趋势:技能正在被当作可安装组件,覆盖多个主流 agent 名单。
Vercel 的 FAQ 还提出了 “skill package” 概念:一个包可以包含一个或多个技能,唯一必需组件仍是 SKILL.md,其它都可选。
4.3 签名校验与供应链:别让技能变成“开源脚本地雷”
技能一旦包含 scripts/,它在安全上就更像一个软件制品,而不是文档;因此建议把“签名、溯源、制品证明”引入技能发布流程。
可操作路线通常是:
- 用 Sigstore(如 cosign)做制品签名与透明日志记录;Sigstore 的理念是让签名更易用,并通过透明日志提升可追溯性。
- 引入 SLSA(Supply-chain Levels for Software Artifacts)作为供应链安全“共同语言”,从构建到发布逐级提升控制强度。
- 如果你在 GitHub Actions 出包,可以结合 GitHub 的 Artifact Attestations 等能力,形成“构建证明 + 可验证发布”的闭环(面向 SLSA 更高等级的要求)。
4.4 开发者实操示例二:一个“CI 失败排查”技能,显式编排 MCP 工具
这个示例的思路是:让技能负责排障流程,让 MCP server 提供可调用工具。GitHub 的官方技能示例就明确了这种组合:在 SKILL.md 里要求用“GitHub MCP Server”提供的工具先列出 workflow runs、再总结失败日志、必要时再拉全量日志。
目录结构:
text
.github/skills/ci-failure-debugging/
SKILL.md
references/
reproduction.md
SKILL.md(示例骨架,工具名按你实际 MCP server 为准):
markdown
---
name: ci-failure-debugging
description: Debug failing CI workflows in a PR. Use when user asks to debug failing GitHub Actions or CI pipelines.
---
# CI Failure Debugging Skill
## Goal
在不把上下文窗口塞满几千行日志的前提下,定位失败原因并给出可验证修复。
## Steps
1. 用 MCP 工具列出最近的 workflow runs(例如 list_workflow_runs)
2. 优先用“摘要型工具”总结失败点(例如 summarize_job_log_failures)
3. 仍不够再拉具体 job/step 的原始日志(例如 get_job_logs)
4. 参考 references/reproduction.md 尝试本地复现
5. 修复后:
- 补充测试用例(能自动化就自动化)
- 解释为何能防止回归
关键实现要点:
- 这是“工具调用与上下文治理”的经典折中:先摘要、后细节,避免把 token 全砸在 log 上。
- 技能正文要把“失败时回退策略”写清楚(例如:拿不到日志就提示权限/工具不可用,然后改用本地复现路线)。这也是开放标准鼓励把工作流做成可审计流程的原因。
5 安全与供应链风险
如果你读到这里还觉得“技能就是个文件夹,能有多危险”,那恭喜你:你已经具备成为供应链攻击受害者的所有心理素质(开玩笑的,但风险是真的)。
5.1 攻击面从哪里来
- 第一类风险:prompt injection / 指令污染。OWASP 的 GenAI 风险项目把 Prompt Injection 作为头号风险(LLM01),并明确指出攻击者可通过输入操控模型行为、绕过既定规则。
- 第二类风险:供应链型风险。OWASP Top 10 for LLM Applications 也把 “Supply Chain Vulnerabilities” 列为重要风险:一旦依赖组件/服务/数据被污染,整体系统就可能被连坐。
- 第三类风险:工具层投毒(Tool Poisoning)与 MCP 组合风险。Invariant Labs 报告了 MCP 生态中的 Tool Poisoning Attacks:把恶意指令藏在工具描述/元数据里,诱导 agent 执行未授权行为;并进一步推出 MCP-Scan 等防护思路。
- 第四类风险:“技能市场”带来的恶意扩散。媒体曾报道某些开放技能市场里出现大量恶意技能(伪装成效率工具,实则窃取凭据/安装恶意软件),其问题本质与浏览器插件、npm 供应链事件高度相似:门槛低 + 扩散快 + 用户默认信任。
此外,哪怕工具本身是官方实现,也可能出现漏洞:例如有报道提到某些 MCP server 曾出现路径校验绕过、参数注入等问题,强调了“工具组合后扩大攻击面”的现实。
5.2 审计方法与最小权限实践
在“技能 + 工具 + 执行环境”的组合拳里,最有效的原则还是三个字:别贪多。
- 最小权限:如果你在用具备沙箱能力的执行环境,务必同时考虑文件系统与网络隔离。Anthropic 的工程博客强调:缺了网络隔离可能外传敏感文件(SSH key 等),缺了文件隔离则可能逃逸并获得更大权限;因此需要两者共同构成边界。
- 把 scripts/ 当生产代码审:代码审查、依赖锁定、静态扫描、禁止“curl | bash”这类高危模式——这属于供应链常识,但在 skills 时代更重要。
- 对外部工具/连接做 allowlist:标准里的 allowed-tools 目前仍是实验性字段,支持程度不一;真正可靠的是执行环境/工具层的强制策略(例如允许访问哪些目录、哪些域名/host)。
- 先摘要、后细节:在日志/文档场景,优先使用“摘要型工具”减少上下文注入面积(GitHub 的技能示例就是这种思路)。
6 生态与未来:标准化、互操作、合规与协作模式
如果把 2025 看作“Skills 被发明并开放”,那 2026 的关键词就是:平台化与治理化。
6.1 平台竞争:谁掌握“技能分发层”,谁就掌握默认入口
GitHub 的路径很清晰:把多个第三方 coding agent 引入同一平台入口,让开发者在同一工作流里挑选不同代理并对比结果;这意味着未来“技能”不仅是 agent 的插件,还是平台之间争夺的生态接口。
Vercel 则押注“分发与发现”:skills CLI + skills.sh 本质上把技能推向了“可安装生态”,并公开强调其覆盖面与统计规模;这种位置一旦站稳,技能就可能像 npm 包一样,先赢得分发,再赢得标准话语权。
6.2 标准化与互操作:从“各家实现”走向“中立治理”
2025-12,围绕 MCP 等基础协议出现了“中立治理”的趋势:Anthropic 宣布将 MCP 捐赠给 Linux Foundation 旗下的 Agentic AI Foundation(AAIF),并提到共同创始方包括 OpenAI 与 Block 等;目标是让这些关键基础设施保持开放、中立、社区驱动。
这件事对 Skills 的意义在于:当“工具连接协议(MCP)”被放进中立治理框架时,“流程封装协议(Skills)”也更容易走向互操作与共同演进——尤其是在安全策略、权限协商、签名校验等“跨平台必须一致”的部分。
6.3 与 AGENTS.md / skill.md 的分工:别把所有鸡蛋都放同一个 Markdown
2026 年的另一个有趣趋势是:框架/平台作者开始提供“面向 agent 的文档入口”。Vercel 的评测文章指出:AGENTS.md 这种“横向、全局”的被动上下文,在某些场景下比按需技能更有效;而 skills 更适合“纵向、动作特定”的工作流(例如迁移、升级、固定操作)——两者是互补关系。
与此同时,Mintlify 推出 /.well-known/skills/default/skill.md 的自动发现与安装思路,强调“让 agent 知道如何使用你的产品”;它引用了 Cloudflare RFC、agentskills proposal、以及 Vercel skills CLI 等作为背景。这条线更像“产品使用说明书分发”,与“技能文件夹(SKILL.md)”并不完全等价,但背后的方向一致:让 agent 获得更可靠、更标准化的外部知识入口。
6.4 法律与合规
当技能进入企业生产环境,它会牵扯到两个合规主题:数据流(工具连接)与责任边界(自动化决策)。以 European Union 的 AI Act 为例,其官方时间线显示法规是分阶段适用的:2025-02 起一般条款与禁止项适用;2025-08 起通用目的 AI 相关规则生效;并规划到 2027-08 完整落地。
但也要注意监管节奏可能受政治与产业博弈影响:有报道提到欧盟曾讨论推迟部分高风险规则的实施时间(以提案/讨论形式出现),因此企业应把合规看作“持续追踪项”而非一次性项目。
在技能层面,可立即做的合规动作包括:
- 把技能许可写清(license 字段或随包附带 LICENSE);
- 明确技能是否需要联网/访问敏感系统(compatibility、内部文档、审批流程);
- 对技能产物(日志、输出文件、调用记录)做可审计留痕:这既是安全治理,也是合规的基础设施。
结语
从 Agent Skills 的核心定义、三层技术架构,到两大高频实操示例、工程化治理体系,再到安全供应链防护与生态合规趋势,我们完成了对这一2026年出圈技术的全维度开发者向拆解。Agent Skills 的价值,从来不是 prompt 的升级,也不是插件市场的复刻,而是 Anthropic 开放标准引领下,为 AI 智能体提供的“可执行入职手册”——它以 SKILL.md 为核心,将流程、脚本、知识封装为可复用、可版本化、可跨平台移植的技能单元,真正打通了“工具连接(MCP)+ 流程封装(Skills)”的企业落地最短路径。
展望未来,2026年的 Agent Skills 生态,正朝着平台化、中立化、合规化稳步前行。GitHub 与 Vercel 的路径博弈,推动技能分发与应用场景持续深化;MCP 协议纳入中立机构治理,为跨平台互操作奠定基础;而欧盟 AI Act 等监管政策的落地,也促使技能从“技术实现”向“合规落地”升级。对于企业与开发者而言,Agent Skills 不再是可选的“效率工具”,而是构建生产级 Coding Agent、实现 AI 规模化落地的核心基础设施。