工程开发数据分析研究
evaluation
为 AI 代理构建系统化的评估框架,利用多维评分标准、LLM-as-a-judge 与回归测试,量测代理效能、质量及上下文工程的有效性。
浏览: 27★ 15,339
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 462 个技能
为 AI 代理构建系统化的评估框架,利用多维评分标准、LLM-as-a-judge 与回归测试,量测代理效能、质量及上下文工程的有效性。
Shopify 整合工具,通过 Membrane CLI 管理电子商务数据、订单、客户资料与商店工作流程。
提供模型上下文协议 (MCP) 服务器开发指南,涵盖工具设计、资源处理及 AI/ML 整合模式。
基于 Model Context Protocol 的 AI 浏览器自动化服务器,支持网页交互、数据提取与深度研究。
为网站和应用程序生成具备一致视觉风格、线条粗细与密度的专业 SVG 图标集,打造独特的品牌 UI 识别。
管理、执行并更新 Gea 框架的 JS 框架基准测试,包含报告生成、HTML 结果刷新与性能比较。
生成、验证并优化 Mermaid 图表(如流程图、时序图、ERD 等),协助可视化软件系统架构与业务工作流程。
为小说家设计的结构化引导工具,涵盖从创作宪法、故事规格到计划、任务、撰写与质量分析的七步创作方法论。
分析 Claude Code 聊天记录以识别编程模式与技能差距,从 HackerNews 精选个性化学习资源,并将成长报告发送至 Slack。
专为 AI Agent 设计的网页阅读与搜索工具,通过 Jina AI Reader API 将网页转换为适合 LLM 阅读的 Markdown、文本或 HTML 格式。
使用 Lightkurve 进行天文光变曲线预处理与清洁。提供离群值移除、趋势平滑化、去趋势与数据质量标记处理工具,适用于天文时序数据分析。
语言无关的后端架构模式,涵盖 API 设计、身份验证、安全性协议与数据库建模。