工程開發
audit-skills avatar

audit-skills

審核 AI 技能的安全性,偵測提示注入、隱藏指令、工具濫用及數據外洩風險。

簡介

audit-skills 代理程式是專為 AI 技能開發人員與平台管理員設計的全面安全評估架構。它提供對技能組件(包括 SKILL.md、腳本檔案與說明文件)的自動化且嚴謹的安全性評估。該工具專為重視 AI 安全性的開發人員打造,協助驗證技能是否符合最小權限原則、縱深防禦與失效安全執行。透過發現階段、內容分析與程式碼審查,它能在技能部署或認證前辨識關鍵漏洞。無論是驗證新專案還是防禦對抗性輸入,此代理程式都能提供具體的補救建議。

  • 自動偵測提示注入模式,包括角色劫持、指令覆蓋與越獄嘗試(如 DAN 攻擊)。

  • 掃描 HTML 註解、零寬字元或不可列印 Unicode 序列中的隱藏指令,防止模型行為遭操縱。

  • 執行腳本檔案的靜態分析,偵測 eval()、exec() 等危險函數以及可能導致指令注入的不安全子程序呼叫。

  • 追蹤資料流並分析外部資源請求,以降低數據外洩向量與未經授權 API 存取的風險。

  • 驗證依賴項完整性,標記未鎖定版本、拼字攻擊(typosquats)或不安全的安裝指令(如管道至 shell)。

  • 檢查檔案系統存取模式,防止路徑遍歷與未經授權的檔案存取。

  • 透過提供技能目錄路徑或上傳 SKILL.md 檔案來觸發此技能,進行即時漏洞掃描。

  • 支援手動與自動化工作流程,並提供適用於 CI 儲存庫整合的腳本。

  • 產出結構化的專業安全性報告,採用標準化檢查清單,適用於合規性審計與技能核准工作流。

  • 限制:提供完整技能目錄時效果最佳;靜態分析可能需要人工審查,以區分良性系統提示與惡意有效載荷。

  • 專為 AI 技能生態系統設計,確保與標準技能佈局與文件格式的相容性。

倉庫統計

Star 數
3
Fork 數
0
Open Issue 數
0
主要語言
Shell
預設分支
main
同步狀態
閒置
最近同步時間
2026年5月3日 下午10:42
在 GitHub 查看