trulens-evaluation-workflow
使用 TruLens 对 LLM 应用程序进行检测、评估与监控的系统化工作流程,支持 LangChain、LangGraph 与 LlamaIndex 等框架。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 556 个技能
使用 TruLens 对 LLM 应用程序进行检测、评估与监控的系统化工作流程,支持 LangChain、LangGraph 与 LlamaIndex 等框架。
一套专业工具集,用于在 Claude Code 环境中审核、评估、切分文档及构建生产级 RAG 管线。
设计完整产品指标仪表板,定义关键绩效指标 (KPI),并建立包含数据可视化、警示阈值与架构整合的监控计划。
FFUF 网络模糊测试专家指南,协助自动化发现隐藏目录、文件、参数及测试渗透测试中的漏洞。
OpenClaw 仓库维护助手:利用 gitcrawl 与 GitHub CLI 进行问题与 PR 的自动化分类、标记及验证。
系统性调试技能,通过追踪调用堆栈查找问题根源,不仅限于修补表象错误,更侧重于识别原始触发点并实施防御性检查。
标准化、验证与管理 Netresearch AI Agent 技能存储库,提供自动化结构执行、发布工作流程与授权合规工具。
全栈应用程序构建编排器,分析自然语言需求以决定技术堆栈、建立项目架构并协调各领域专业代理人。
自动化质量闸门,使用 5 个并行 AI 代理审查代码变更,确保正确性、风格与一致性。
进阶视觉回归测试工具,具备像素级与AI辅助差异分析、跨浏览器验证及响应式设计检查,有效防止CI/CD流程中的UI回归问题。
专为现代 Web 应用程序设计的进阶 TypeScript 与 React 开发助手。精通组件架构、状态管理、Vitest 单元测试、Playwright 端对端自动化以及高效的 TypeScript 配置。
为 Windows App SDK 仓库生成分类报告并分析功能区域健康状况。识别高优先级问题、待处理事项与团队重点领域。