工程开发数据分析自动化
trulens-evaluation-workflow
使用 TruLens 对 LLM 应用程序进行检测、评估与监控的系统化工作流程,支持 LangChain、LangGraph 与 LlamaIndex 等框架。
浏览: 11★ 3,286#trulens#llm#evaluation#workflow
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 321 个技能
使用 TruLens 对 LLM 应用程序进行检测、评估与监控的系统化工作流程,支持 LangChain、LangGraph 与 LlamaIndex 等框架。
客户问题与调查研究工具,提供多来源信息整合、事件追踪、账户历史记录查询,并包含来源标注与信赖度评分。
具备工作阶段追踪功能的番茄钟计时器,通过本地 SQLite 数据库记录工作历程,提供生产力数据分析与个性化工作效率洞察。
将 PDF、Office 文档、图像、音频及网页内容转换为适合 LLM 与 RAG 系统的干净 Markdown 格式,支持 20 多种文件类型与自动化处理。
进行策略性竞争分析,绘制市场格局,识别直接竞争对手,综合评估优劣势,并发掘差异化机会。
为软件代理提供的稳健验证与质量保证系统,具备实时真相评分、自动化代码验证以及即时回滚功能,以确保高质量的输出与可靠性。
通过分析持续集成 (CI) 历史、执行模式与代码结构,识别、分类并排除不稳定的测试 (flaky tests),以提升测试套件的可靠性。
Fabric CLI 智能模式选择工具,从 242+ 种专业提示中自动选取最合适的模式,支持威胁建模、数据分析、摘要与内容创作。
将气象与环境变量分类为驱动因素类别,以进行一致的归因分析与环境建模。
提供识别、审查与管理由 GitHub Copilot 编码代理在存储库中创建的提取请求 (PR) 的操作指南与技巧。
统一的内容提取与行动规划引擎。自动将 URL(YouTube、文章、PDF)处理为可执行的行动计划。
系统性性能工程:基准测试、性能分析、瓶颈诊断,以及基于实证的应用程序优化指导。