evaluation
为 AI 代理构建系统化的评估框架,利用多维评分标准、LLM-as-a-judge 与回归测试,量测代理效能、质量及上下文工程的有效性。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 557 个技能
为 AI 代理构建系统化的评估框架,利用多维评分标准、LLM-as-a-judge 与回归测试,量测代理效能、质量及上下文工程的有效性。
local-skills-mcp 仓库实现指南。提供关于 MCP 工具处理程序、技能加载与聚合逻辑,以及项目结构的详细技术文档,帮助开发者快速理解与开发。
使用智谱 (Zhipu) AI 网页搜索 API 进行互联网搜索,快速获取即时资讯、新闻与最新数据。
创建、测试并验证用于检测安全漏洞与代码模式的自定义 Semgrep 规则。
一个用于构建模块化、可重复使用 Agent 技能的框架。提供有关构建 SKILL.md、脚本、参考资料和资源的使用指南,以扩展 Claude 的功能。
使用 Better Auth 在 TypeScript/JavaScript 应用程序中构建与实现身份验证。自动检测框架、配置数据库适配器、设置路由处理程序、加入 OAuth 提供者并创建 UI 页面。
开发与维护 PWAFire 工具库:编写 PWA API 模块、处理功能检测、管理测试,并遵循严格的同步/异步模式与错误处理规范贡献代码。
Claude Skills 安全扫描工具,用于在安装前检测恶意代码、数据泄露风险及未经授权的系统访问,确保环境安全。
实现 React 19 模式:React Compiler、Server Actions、表单与新 hook(如 'use')。指导在 Actions 与 TanStack Query 之间进行变更处理的决策。
使用 Rust、Axum 与 HTMX 构建交互式超媒体 Web 应用程序,无需复杂的 JavaScript 框架即可实现动态与实时 UI 更新。
将 Snowflake 与 MCP 客户端整合。管理 Snowflake 端点、验证连接,并直接在您的 AI 工作流程中运用 Cortex AI (Search, Analyst, Agent) 服务。
将资产从 EVM 链桥接至 Starknet,部署代理帐户,并向 HuginnRegistry 注册身份,以实现自主 AI 代理的入职流程。