工程開發自動化
eval-harness
AI 代理會話的正式評估框架,實施評估驅動開發 (EDD) 原則以確保代理可靠性。
瀏覽: 30★ 169,888
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 409 個技能
AI 代理會話的正式評估框架,實施評估驅動開發 (EDD) 原則以確保代理可靠性。
適用於 MCP 的辯證推理與對抗式編碼代理,透過強制 LLM 解決內部矛盾,產出更高品質的推理與程式碼。
生產級 Scrum Master 助理,用於衝刺管理、產能規劃及即時團隊分析。
實作生產級 AI 代理。包含 LangGraph、工具調用護欄、SSE 串流、情節記憶與 pgvector。提供反模式分析與修正代碼。
自主研究專員,專注於獲取驗證資訊、評估來源並進行結構化綜述。
防止 AI 幻覺,確保在分析程式碼、技術文件或提供建議時,輸出具備證據支持且可驗證的內容。
基於 Playwright 的完整瀏覽器自動化技能。具備自動檢測開發伺服器、產生測試腳本、螢幕截圖、表單填寫、響應式測試與使用者體驗驗證功能。
AI 驅動的口播影片剪輯 Agent,提供語音轉錄、口誤偵測與網頁版審核流程。
管理日曆行程,查詢空檔並在通話或對話中無縫安排會議。
完整的 API 自動化測試解決方案,支援 REST/GraphQL。提供功能測試、效能測試、合約測試與 Mock 服務整合。
MERIDIAN 自主 AI 代理實作模式,包含 BaseAgent 生命週期、Claude API 結構化工具呼叫、Token 配額管理與 cron 排程系統。
GoHighLevel 工作流自動化專家。整合 Hylo GHL API 以管理工作流程、API 端點、UI 導航與自動化規劃。