工程開發自動化
eval-harness
AI 代理會話的正式評估框架,實施評估驅動開發 (EDD) 原則以確保代理可靠性。
瀏覽: 30★ 169,888
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 483 個技能
AI 代理會話的正式評估框架,實施評估驅動開發 (EDD) 原則以確保代理可靠性。
透過 ReasoningBank 實現代理程式的自適應學習,進行模式識別、策略優化與持續改進。
執行基於 Gradle 的 Java 測試,過濾失敗結果與關鍵統計數據,並提供精簡報告以簡化後端開發與除錯。
DashPlayer 日志聚焦除錯技能:隔離功能日誌鏈、注入臨時標記([FOCUS:token]),並確保任務完成後清理除錯代碼。
強化版規劃模式。透過結構化需求導入與具體技術方案選擇,協助工程師在動手寫程式前先建立產品思維。
驗證區塊鏈智能合約代碼與技術規範、白皮書及設計文件的對應性,確保實作與規格完全一致。
適用於 MCP 的辯證推理與對抗式編碼代理,透過強制 LLM 解決內部矛盾,產出更高品質的推理與程式碼。
AI 輔助代碼代理版本控制。透過 MemoV 自動追蹤提示詞、上下文與差異,確保完整可追溯性,且不污染 Git 歷史紀錄。
使用 Mike Cohn 格式與 Gherkin 驗收標準建立結構化用戶故事,將需求轉化為可測試且可供開發的任務。
設計與記錄 REST 或 GraphQL API,包含端點定義、分頁、篩選、版本控制及 OpenAPI/Swagger 規格建立。
為所有軟體開發任務提供強制性的執行驗證。在確認結果前,透過實際運行來確保代碼功能正確。
自主研究專員,專注於獲取驗證資訊、評估來源並進行結構化綜述。