eval-harness
克劳德代码会话的正式评估框架,实施评估驱动开发(EDD)原则,用于保障 AI 代理的可靠性。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 538 个技能
克劳德代码会话的正式评估框架,实施评估驱动开发(EDD)原则,用于保障 AI 代理的可靠性。
扫描 Solana 程序 (原生/Anchor) 以查找 6 种关键漏洞,包括任意 CPI、不当 PDA 验证及缺失所有权检查,并提供详细的修复建议。
部署专业 AI 代理集群进行全面的 GitHub Pull Request 审查,涵盖安全性、性能、架构及代码风格分析。
管理 Fly.io 边缘基础设施:通过 Fly.io Machines API 部署应用、扩展机器、配置存储卷、密钥与网络。Python 编写,无外部依赖。
通过 CLI 创建、修改并验证 Snowflake 语义视图 (Semantic Views)。自动化生成、说明与测试语义层定义,确保模型准确性与星型架构合规。
用于构建多代理系统、AgentOS 运行时及整合 MCP 服务器的 AI 代理开发框架。
构建独特、高品质的 React Native Expo 界面,运用液态玻璃设计与 iOS 人机界面准则,打造工业级移动应用。
建立并生成新的 GitHub Copilot 代理技能。提供模板、目录结构与说明,协助您通过绑定的资源构建专属的 AI 功能。
Claude Code 钩子的系统化调试工作流程。用于解决钩子无法触发、输出错误或行为异常等问题。
诊断并解决 Dojo.js 应用程序中的连接、同步、订阅及类型问题。用于排解 Torii、实体查询和状态更新故障。
使用 pygount 分析代码库统计数据:代码行数 (LOC)、语言分布及代码与注释比例。
一个 CTF 解题代理程序,负责对挑战进行初步分类筛选,识别漏洞类别,并将任务分派给专业技能,涵盖 Web、Pwn、加密、取证与逆向工程分析。