工程開發資料分析研究
evaluation
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
瀏覽: 26★ 15,339
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 206 個技能
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
管理專案單一事實來源 (SSOT)、記憶體及跨工具搜尋。作為 Claude Code 的 decisions.md 與 patterns.md 守護者,用於維護上下文、同步記憶及追蹤決策。
用於建立、維護與增強 CLAUDE.md 檔案的自動化工具,確保您的專案 AI 輔助開發準則準確、模組化且符合最佳實踐。
進階提示詞改寫與優化服務。分析提示詞的清晰度、具體性與結構,提供可執行的優化建議、多種變體選項,並教授提示工程的最佳實踐。
一個系統化的多角度網頁研究代理。適用於深度調查、複雜問題查詢,以及在內容生成前作為強制性的研究步驟,確保獲得有據可查的高質量結果。
一套標準化工作流程,用於將原始 PM 筆記、工作坊內容或初稿轉化為經過驗證且符合儲存庫規範的 AI 技能。
對登陸頁面進行結構化的 8 要素轉化率優化 (CRO) 審計,識別轉化阻礙並提供增長建議。
AI 代理技能安全審查協議。在安裝前檢測憑證竊取、混淆代碼及未經授權的數據傳輸等安全風險。
GitHub 自動化 PR 審查代理,運用 gh CLI 進行程式碼品質、安全性分析及專案標準合規性檢查。
安全地執行、測試並驗證文件中的命令,支援真實輸出擷取、效能追蹤與 Git 安全協定。
indiiOS 的自動遞迴執行引擎,負責管理任務完成、狀態驗證與錯誤處理。
為 LLM 設定的程式開發行為準則,旨在減少錯誤、落實最佳實踐,並透過強調簡潔性、精確修改與目標導向驗證來提升代碼品質。