工程开发自动化
eval-harness
克劳德代码会话的正式评估框架,实施评估驱动开发(EDD)原则,用于保障 AI 代理的可靠性。
浏览: 30★ 169,888
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 409 个技能
克劳德代码会话的正式评估框架,实施评估驱动开发(EDD)原则,用于保障 AI 代理的可靠性。
适用于 MCP 的辩证推理与对抗式编码代理,通过强制 LLM 解决内部矛盾,产出更高质量的推理与代码。
生产级 Scrum Master 助理,用于冲刺管理、产能规划及实时团队分析。
实现生产级 AI 代理。包含 LangGraph、工具调用护栏、SSE 流式传输、情节记忆与 pgvector。提供反模式分析与修正代码。
自主研究专员,专注于获取验证信息、评估来源并进行结构化综述。
防止 AI 幻觉,确保在分析代码、技术文档或提供建议时,输出具备证据支持且可验证的内容。
基于 Playwright 的完整浏览器自动化技能。具备自动检测开发服务器、生成测试脚本、屏幕截图、表单填写、响应式测试与用户体验验证功能。
AI 驱动的口播视频剪辑 Agent,提供语音转录、口误识别与网页版审核流程。
管理日历行程,查询空档并在通话或对话中无缝安排会议。
API 接口测试自动化工具,支持 REST/GraphQL。集成功能测试、性能测试、契约测试及 Mock 服务,提供完整测试解决方案。
MERIDIAN 自主 AI 代理实现模式,包含 BaseAgent 生命周期、Claude API 结构化工具调用、Token 配额管理与 cron 调度系统。
GoHighLevel 工作流自动化专家。集成 Hylo GHL API 以管理工作流程、API 端点、UI 导航与自动化规划。