eval-harness
克劳德代码会话的正式评估框架,实施评估驱动开发(EDD)原则,用于保障 AI 代理的可靠性。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 433 个技能
克劳德代码会话的正式评估框架,实施评估驱动开发(EDD)原则,用于保障 AI 代理的可靠性。
使用并行子代理执行 Semgrep 源代码静态分析,支持多语言检测与 Pro 版本跨文件污染分析。
一套用于开发与打包复杂、多组件 React/TypeScript 网页实体的工具包,整合了 Vite、Tailwind CSS 与 shadcn/ui。
通过结构化的自我评估检查点,确保 AI 在任务执行前、中、后的方案验证与风险管控,提升程序开发质量。
打造价值 $50,000 美元级别的专业前端界面,提供生产级代码、精选排版与高质量影像素材整合。
自动化完整的 Git 工作流程,包含提交、PR 创建、CI 监控与合并,并强制执行惯例提交 (Conventional Commits) 规范。
管理 OpenClaw 内置 Chrome 浏览器及 chrome-devtools-mcp 集成,通过 MCP 协议进行稳定的浏览器自动化操作。
用于路线图管理的视觉化网页工作区,提供互动式看板与基于图表的依赖关系视图,辅助任务规划与项目进度追踪。
FlowGram.ai 自定义节点开发指南,支持简单节点自动表单与复杂节点自定义 UI 开发。
自动化整理发票和收据以进行税务准备。通过读取混乱文件、提取关键财务信息、统一重命名文件并将其分类存储到逻辑文件夹中。
根据自然语言描述生成优化后的 SQL 查询。支持 BigQuery、PostgreSQL、MySQL 与 Snowflake 等多种数据库方言。分析数据库架构、解读业务需求,并输出包含详细说明的可执行查询。
为 LangChain 应用程序提供统一接口,整合并管理 OpenAI、Anthropic、Google、Azure 和 Bedrock 等 LLM 聊天模型服务。