trulens-evaluation-workflow
使用 TruLens 对 LLM 应用程序进行检测、评估与监控的系统化工作流程,支持 LangChain、LangGraph 与 LlamaIndex 等框架。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 236 个技能
使用 TruLens 对 LLM 应用程序进行检测、评估与监控的系统化工作流程,支持 LangChain、LangGraph 与 LlamaIndex 等框架。
全面的 iOS 与 Android 移动测试解决方案,涵盖手势、传感器、权限、设备碎片化及性能,支持超过 1000 种真实与虚拟设备。
一套系统化的代码审计框架,用于识别软件项目中的技术债、安全漏洞、无效代码及代码质量问题。
使用 Great Expectations、dbt 测试与数据契约实现生产级数据质量验证,确保数据管道的可靠性。
快速查询 SaaS 财务指标、公式与基准。通过即时访问定义、决策框架与异常预警指标,提升您的财务分析效率。
JUCE 音频插件手动测试套件。提供自动化测试执行、pluginval 验证(严格等级 10)以及用于稳定性与质量保证的 DAW 手动测试检查清单。
在浏览器中使用 Jupyter Notebook 交互式测试 Adobe EDS 区块。支持 ES6 导入、覆盖层预览、响应式设备测试及零依赖执行环境。
基于 scverse 最佳实践的自动化单细胞 RNA-seq 质量控制工具。支持 .h5ad 与 .h5 格式,提供 MAD 离群值检测、细胞过滤及统计可视化分析。
用于部署、管理和监控 DataRobot 模型的工具,包含预测环境配置、冠军/挑战者模型工作流程以及部署操作。
对本地更改或 GitHub 远程合并请求进行自动化代码审查。通过整合 git 和 gh CLI,分析代码的正确性、可维护性及标准遵循。
生产级 Go 开发支持:包含并发模式、惯用语法错误处理、接口设计、testify 测试框架,以及用于构建可扩展后端服务的最佳实践。
用于验证 AI 代理技能配置并检测规则违规的测试夹具。