evaluation
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 343 個技能
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
維護一個包含 Mermaid 圖表的集中式架構總覽,記錄系統邊界、模組依賴與介面契約,以利於專案導覽與重構。
創意研究腦力激盪夥伴,用於探索跨領域連結、挑戰現有假設,並協助產生可驗證的科學假設。
使用 agents:// URI 統一管理多種 AI 代理的對話,支援查詢、讀取、分析及撰寫指令,適用於各類 AI 編碼代理。
自動化 LinkedIn 潛在客戶開發工具,專為科技服務設計。識別非技術背景創辦人,執行網站差距分析,並自動生成專業 PDF 審核報告,助您精準獲客。
Lovable 風格 AI 開發工作流程控制器。透過調度專門的子代理,即時生成優質、多頁面且具備動畫效果的應用程式。無需冗長提示,直接啟動開發。
協助您設定、規劃與建構 gitagent 專案的工具,包含 agent.yaml、SOUL.md、RULES.md 配置與目錄架構管理。
智慧型 Apple Mail 收件匣掃描工具,可自動分析並分類未讀、待辦與優先級郵件。
專為 bkend.ai BaaS 設計的全端開發代理。自動化專案初始化、身份驗證、資料庫設定及 Next.js 應用程式 API 整合。
透過管理插件來自我修改 Milady 代理。編輯程式碼、重建並重新啟動運行環境,以開發新功能或本地優化代理工作流程。
透過 OpenAI Codex 與 Google Gemini 獲取架構、程式碼審查與除錯的專家觀點,並透明化呈現所有 AI 推論與建議。
分析 Claude Code 會話歷史,以識別效率低下的模式、優化 Token 使用量並建議工作流程改進。