工程开发自动化
eval-harness
克劳德代码会话的正式评估框架,实施评估驱动开发(EDD)原则,用于保障 AI 代理的可靠性。
浏览: 30★ 169,888
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 483 个技能
克劳德代码会话的正式评估框架,实施评估驱动开发(EDD)原则,用于保障 AI 代理的可靠性。
通过 ReasoningBank 实现代理程序的自适应学习,进行模式识别、策略优化与持续改进。
执行基于 Gradle 的 Java 测试,过滤失败结果与关键统计数据,并提供精简报告以简化后端开发与调试。
DashPlayer 日志聚焦调试技能:隔离功能日志链、注入临时标记([FOCUS:token]),并确保任务完成后清理调试代码。
强化版规划模式。通过结构化需求导入与具体技术方案选择,协助工程师在动手写代码前先建立产品思维。
验证区块链智能合约代码与技术规范、白皮书及设计文件的对应性,确保实现与规格完全一致。
适用于 MCP 的辩证推理与对抗式编码代理,通过强制 LLM 解决内部矛盾,产出更高质量的推理与代码。
AI 辅助代码代理版本控制。通过 MemoV 自动追踪提示词、上下文与差异,确保完整可追溯性,且不污染 Git 历史记录。
使用 Mike Cohn 格式与 Gherkin 验收标准建立结构化用户故事,将需求转化为可测试且可供开发的任务。
设计与记录 REST 或 GraphQL API,包含端点定义、分页、筛选、版本控制及 OpenAPI/Swagger 规范建立。
为所有软件开发任务提供强制性的执行验证。在确认结果前,通过实际运行来确保代码功能正确。
自主研究专员,专注于获取验证信息、评估来源并进行结构化综述。