evaluation
为 AI 代理构建系统化的评估框架,利用多维评分标准、LLM-as-a-judge 与回归测试,量测代理效能、质量及上下文工程的有效性。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 506 个技能
为 AI 代理构建系统化的评估框架,利用多维评分标准、LLM-as-a-judge 与回归测试,量测代理效能、质量及上下文工程的有效性。
自动化 LinkedIn 潜在客户开发工具,专为科技服务设计。识别非技术背景创始人,执行网站差距分析,并自动生成专业 PDF 审核报告,助您精准获客。
通过模型上下文协议 (MCP) 在实时与模拟外部依赖项之间无缝切换,支持自动化开发环境。
SpecKit 模板架构专家,管理规格驱动开发 (SDD)、设计模式以及微服务生命周期自动化。
Claude Messages API 专家指南:涵盖结构化输出、提示词缓存、工具使用,以及从 Claude 3.x 迁移至 4.5 的关键信息,协助开发者解决常见 API 错误与性能问题。
使用 Kokoro TTS 进行本地文字转语音。在终端中生成音频、朗读文本并处理多语言语音合成。
验证并协调批次学习指南操作,通过强制执行模板兼容性、文件可用性及仅限来源政策,在代理程序执行前防止错误。
从 Printables 搜索并下载 3D 模型,自动生成包含授权信息与文件的清单,适用于 3D 打印与原型开发流程。
使用 Skills Hub CLI 管理、同步并应用 AI Agent 技能、Kit 与预设。通过浏览目录、检视配置并部署精选的指令策略与技能包,简化您的项目配置流程。
通过 Smithery CLI 查找、连接并使用超过 10 万个 MCP 工具与技能,整合外部服务、管理智能体工作空间并实现自动化工作流。
通过自动化测试执行器、人工 LLM 判断与结构化报告,评估 Deca 代理提示词与行为一致性。
GoHighLevel 工作流自动化专家。集成 Hylo GHL API 以管理工作流程、API 端点、UI 导航与自动化规划。