工程开发
audit-skills
审核 AI 技能的安全性,检测提示注入、隐藏指令、工具滥用及数据外泄风险。
简介
audit-skills 代理程序是专为 AI 技能开发人员与平台管理员设计的全面安全评估框架。它提供对技能组件(包括 SKILL.md、脚本文件与说明文档)的自动化且严谨的安全性评估。该工具专为重视 AI 安全性的开发人员打造,协助验证技能是否符合最小权限原则、纵深防御与失效安全执行。通过发现阶段、内容分析与代码审查,它能在技能部署或认证前识别关键漏洞。无论是验证新项目还是防御对抗性输入,此代理程序都能提供具体的补救建议。
-
自动检测提示注入模式,包括角色劫持、指令覆盖与越狱尝试(如 DAN 攻击)。
-
扫描 HTML 注释、零宽字符或不可打印 Unicode 序列中的隐藏指令,防止模型行为遭操纵。
-
执行脚本文件的静态分析,检测 eval()、exec() 等危险函数以及可能导致指令注入的不安全子程序调用。
-
追踪数据流并分析外部资源请求,以降低数据外泄向量与未经授权 API 访问的风险。
-
验证依赖项完整性,标记未锁定版本、拼写攻击(typosquats)或不安全的安装指令(如管道至 shell)。
-
检查文件系统访问模式,防止路径遍历与未经授权的文件访问。
-
通过提供技能目录路径或上传 SKILL.md 文件来触发此技能,进行即时漏洞扫描。
-
支持手动与自动化工作流程,并提供适用于 CI 存储库集成的脚本。
-
产出结构化的专业安全性报告,采用标准化检查清单,适用于合规性审计与技能核准工作流。
-
限制:提供完整技能目录时效果最佳;静态分析可能需要人工审查,以区分良性系统提示与恶意有效载荷。
-
专为 AI 技能生态系统设计,确保与标准技能布局与文档格式的兼容性。
仓库统计
- Star 数
- 3
- Fork 数
- 0
- Open Issue 数
- 0
- 主要语言
- Shell
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年5月3日 22:42