evaluation
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 327 個技能
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
使用 LangChain 1.x 與 LangGraph 架構生產級 LLM 應用程式。實現狀態化 AI 代理、多步驟工作流程,並為複雜的對話與自動化任務建構自訂記憶系統。
管理部落格文章從構思、大綱擬定到草稿撰寫與編輯的全生命週期,專為 Nuxt/Vue 開發者設計。
面向 AI 輔助開發的虛擬任務管理系統。透過精準的上下文注入,高效管理任務生命週期、依賴關係及測試驅動開發 (TDD) 工作流。
將工作階段的經驗轉化為可重用的智能基礎設施 (RII)。將一次性的修復與模式發現轉變為永久的代理執行知識,防止問題重現並加速後續開發。
同步並維護儲存庫中的 CLAUDE.md 與 README.md 文件層級,確保 AI 代理程式擁有即時且一致的上下文資訊。
使用 validate_skills.py 驗證 Skills、Agents 與 Commands 的語法,記錄錯誤並管理代理開發的自動化質量控制流程。
Python 統計視覺化程式庫。透過 Pandas 整合與自動統計估計,輕鬆製作盒鬚圖、熱圖與小提琴圖等出版級品質的統計圖表。
視覺化 Azure 雲端基礎架構,映射資源依賴關係,並使用 Mermaid 和 PlantUML 生成架構圖。
AI 程式代理的共享記憶與協作層,用於追蹤操作、管理工作階段、偵測衝突,並跨工具保留專案上下文。
一個系統化的多角度網頁研究代理。適用於深度調查、複雜問題查詢,以及在內容生成前作為強制性的研究步驟,確保獲得有據可查的高質量結果。
設計與構建高品質 AI Agent Skills 的專家顧問。透過發現、架構與製作階段的結構化引導,確保您建立的技能具備高度一致性、可組合性與執行效能。