evaluation
为 AI 代理构建系统化的评估框架,利用多维评分标准、LLM-as-a-judge 与回归测试,量测代理效能、质量及上下文工程的有效性。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 391 个技能
为 AI 代理构建系统化的评估框架,利用多维评分标准、LLM-as-a-judge 与回归测试,量测代理效能、质量及上下文工程的有效性。
使用 ElevenLabs 将临床文本转换为自然且具同理心的语音,适用于病患宣教、用药提醒及各类医疗辅助内容。
技术文档专业编写团队。通过 ORCHESTRATOR 原则调度专家,产出合规的产品指南、概念说明与 API 参考文档。
分析 Markdown 文件以识别浪费 Token 的模式,并提供具体优化建议,以提升文档对 AI 的 Token 使用效率与清晰度。
Serena MCP 语义代码分析指南。Serena MCP 连接时自动启用,优先使用专用工具进行符号搜索、引用追踪及代码记忆,以优化分析效率与准确性。
PAI 的实体合成桥梁。生成蓝图、3D 打印代码、激光切割 SVG 路径以及 CNC 加工 G-Code,将代理设计转化为实体硬件。
分析搜索结果 (SERP) 以进行用户意图分类、识别功能机会,并针对内容策略进行竞争情报分析。
通过 API 管理 YNAB 预算、追踪支出并自动化财务报告。支持记账、目标监控及自动化预算分析功能。
基于 Gemini 的高级网络搜索插件,具备智能缓存、子代理上下文隔离及自动查询优化功能。
Archon 交互式集成工具,提供知识库与项目管理功能。支持 RAG 语义搜索、网站抓取、文档版本控制以及通过 REST API 进行层级化任务管理。
验证并协调批次学习指南操作,通过强制执行模板兼容性、文件可用性及仅限来源政策,在代理程序执行前防止错误。
实现生产级 AI 代理。包含 LangGraph、工具调用护栏、SSE 流式传输、情节记忆与 pgvector。提供反模式分析与修正代码。