工程开发数据分析研究
evaluation
为 AI 代理构建系统化的评估框架,利用多维评分标准、LLM-as-a-judge 与回归测试,量测代理效能、质量及上下文工程的有效性。
浏览: 25★ 15,339
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 193 个技能
为 AI 代理构建系统化的评估框架,利用多维评分标准、LLM-as-a-judge 与回归测试,量测代理效能、质量及上下文工程的有效性。
用于跨设备与团队管理代理技术的私人套件分发系统。通过中央库目录安装、同步、新增与更新您的代理、技能与提示词。
开发与维护 PWAFire 工具库:编写 PWA API 模块、处理功能检测、管理测试,并遵循严格的同步/异步模式与错误处理规范贡献代码。
自动化研究资源准备工作,包括加载实例、搜索 GitHub 代码库、构建数据集描述以及下载 arXiv 论文。
虚拟机开发专家,专注于字节码设计、栈式/寄存器虚拟机实现、内存管理及垃圾回收机制。
通过 DeepWiki 和 MCP 搜索并检索超过 300 个热门 GitHub 仓库的 AI 生成文档、架构指南与 API 参考资料。
HashQL 测试策略指南,涵盖 compiletest (UI 测试)、单元测试与 insta 快照测试。包含 --bless 指令、//~ 注解语法及各编译器组件的测试建议。
专门用于代码重构的技能。在不改变外部行为的前提下提高代码可维护性、减少技术债务并应用设计模式。
通过 Redis 缓存、集群运算、性能分析与监控技术,优化 Node.js 应用程序性能,打造高效且可扩展的后端服务。
您的专属 AI 编程导师,根据您的实际代码库创建个性化教程,追踪学习进度并利用间隔重复法确保技术掌握。
适用于 M5Stack Tab5 的 UI 组件模式与触控输入处理,支持 M5GFX 与 LVGL 开发。
标准化 Fish shell 配置、脚本编写模式以及点文件环境的系统管理。