evaluation
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 557 個技能
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
local-skills-mcp 儲存庫實作指南。提供關於 MCP 工具處理程式、技能載入與聚合邏輯,以及專案結構的技術文件,協助開發者快速上手。
使用智譜 (Zhipu) AI 網頁搜尋 API 進行網際網路搜尋,快速獲取即時資訊、新聞與最新數據。
創建、測試並驗證用於偵測安全漏洞與程式碼模式的自訂 Semgrep 規則。
一個用於構建模組化、可重複使用 Agent 技能的框架。提供有關建構 SKILL.md、腳本、參考資料和資源的指南,以擴展 Claude 的功能。
使用 Better Auth 在 TypeScript/JavaScript 應用程式中構建與實作身份驗證。自動偵測框架、配置資料庫介面卡、設定路由處理常式、加入 OAuth 提供者並建立 UI 頁面。
開發與維護 PWAFire 工具庫:編寫 PWA API 模組、處理功能檢測、管理測試,並遵循嚴格的同步/非同步模式與錯誤處理規範貢獻程式碼。
Claude Skills 安全掃描工具,可檢測惡意代碼、數據洩露風險及未經授權的系統訪問,確保安裝安全。
實現 React 19 模式:React Compiler、Server Actions、表單與新 hook(如 'use')。指導在 Actions 與 TanStack Query 之間進行變更處理的決策。
使用 Rust、Axum 與 HTMX 構建互動式超媒體網頁應用程式,無需複雜的 JavaScript 框架即可實現動態與即時 UI 更新。
將 Snowflake 與 MCP 客戶端整合。管理 Snowflake 端點、驗證連接,並直接在您的 AI 工作流程中運用 Cortex AI (Search, Analyst, Agent) 服務。
將資產從 EVM 鏈橋接至 Starknet,部署代理帳戶,並向 HuginnRegistry 註冊身份,以實現自主 AI 代理的入職流程。