trulens-evaluation-workflow
使用 TruLens 对 LLM 应用程序进行检测、评估与监控的系统化工作流程,支持 LangChain、LangGraph 与 LlamaIndex 等框架。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 136 个技能
使用 TruLens 对 LLM 应用程序进行检测、评估与监控的系统化工作流程,支持 LangChain、LangGraph 与 LlamaIndex 等框架。
搜索、分析并审计 GeminiClaw 会话记录与记忆。用于调查过往交互、追踪 Token 用量、调试工具调用及监控代理程序性能。
高级测试报告与质量仪表板,提供 QE 指标、代码覆盖率与部署就绪度分析,通过预测性洞察协助团队进行数据驱动的质量决策。
管理、执行并更新 Gea 框架的 JS 框架基准测试,包含报告生成、HTML 结果刷新与性能比较。
通过基于协议的行为治理,协调 Claude Code 并行工作集群,以执行复杂功能开发、多步骤重构及长时间运行的自动化编程任务。
为 Python、Node.js 和 Java 应用程序提供基于执行轨迹与 MCP 工具的实证调试解决方案。
基于 Base 的隐私交易工具。利用 Veil Cash 进行资产池存款,通过零知识证明 (ZK proofs) 执行私密提款与转账。支持 ETH 与 USDC,并整合 Bankr 用于签署存款交易。
用于选择 MCP 工具与直接 API 技能的决策框架,旨在优化 AI 代理的性能、成本与执行效率。
自动化质量监控与度量,包含 DORA 指标、缺陷密度追踪,并为持续交付流水线配置智能质量闸道。
React 与 Vite 性能优化指南。适用于编写、审查或优化基于 Vite 构建的 React 组件。
虚拟机开发专家,专注于字节码设计、栈式/寄存器虚拟机实现、内存管理及垃圾回收机制。
Elasticsearch DBA 技能,专注于集群架构、索引与映射设计、性能调优及生产环境运维,涵盖 ILM、分片策略与故障排查。