eval-harness
克劳德代码会话的正式评估框架,实施评估驱动开发(EDD)原则,用于保障 AI 代理的可靠性。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 2091 个技能
克劳德代码会话的正式评估框架,实施评估驱动开发(EDD)原则,用于保障 AI 代理的可靠性。
指导如何使用 itBundled 与 expectBundled 编写 Bun bundler 测试,以验证转译、压缩及代码转换的正确性。
Three.js 材质库:包含 PBR、基础、Phong、着色器材质及属性。适用于网格样式设计、纹理映射、自定义 GLSL 着色器以及优化 3D 材质渲染性能。
AI 技术 SEO 审计工具,执行 Lighthouse/PageSpeed 测评并自动修复网站性能、无障碍网页与结构化数据等代码问题。
分析 GitHub 仓库的结构、文档、依赖关系及贡献者模式,以进行代码库健康检查与开发洞察。
通过技术 SEO、Meta 标签设置、结构化数据与 Sitemap 管理,优化网站搜索引擎可见性,提升抓取效率与搜索排名。
Opentrons 官方实验室自动化协议 API,适用于 OT-2 与 Flex 机器人。用于编写、模拟及执行包含液体处理与硬件模块控制的实验室自动化协议。
Jimeng Seedance 2.0 专业提示词工程工具。利用 @ 语法引用图片、视频与音频素材,精准控制镜头运动、节奏、视觉特效及多模态视频生成。
基于 API 的 AI 图像生成工具,支持 OpenAI、Azure、Google、OpenRouter、DashScope、Replicate 等多个模型。提供文字生成图像、参考图引导、比例控制及批次处理功能。
将 X (Twitter) 推文与文章转换为包含 YAML 前言的 Markdown。支持线程、媒体下载,并使用逆向工程 API 进行提取。
用于调查 Payload CMS 仓库中 CI 不稳定测试失败的系统性分类与复现工作流程。
专业数据库设计与存取模式:涵盖架构设计、索引策略、查询优化、存储库模式以及 SQL 与 NoSQL 数据库的事务处理。