工程开发数据分析自动化
trulens-evaluation-workflow
使用 TruLens 对 LLM 应用程序进行检测、评估与监控的系统化工作流程,支持 LangChain、LangGraph 与 LlamaIndex 等框架。
浏览: 11★ 3,286#trulens#llm#evaluation#workflow
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 394 个技能
使用 TruLens 对 LLM 应用程序进行检测、评估与监控的系统化工作流程,支持 LangChain、LangGraph 与 LlamaIndex 等框架。
根据暂存区的 git diff 自动生成符合 Conventional Commits 规范的清晰提交信息。
自动化 Vitest 管理技能:处理 TypeScript/JavaScript 项目的测试执行、覆盖率报告、失败诊断及配置管理。
设计与构建高质量 AI Agent Skills 的专家顾问。通过发现、架构与制作阶段的结构化引导,确保您建立的技能具备高度一致性、可组合性与执行效能。
根据您的工作流程调整现有技能,或为重复性且耗时的任务建立新技能。
根据产品代码手册将测试工程师的缺陷描述标准化,修正错别字、缩写错误与歧义,并执行站点验证。
为提示词中的 JSON 数据提供认知安全分析,防止大型语言模型在处理不完整或大规模数据集时产生幻觉与推理错误。
基于 DuckDB 的持久化状态管理与工作流程分析工具,支持任务依赖追踪、历史指标与上下文检查点功能。
通过 Turing Tavily 代理进行实时网页搜索。适用于查找最新信息、研究时事,以及获取训练数据库以外的实时数据。
自动化 Rust 验证循环,整合测试、Clippy 代码检查与格式化功能,并具备自动修复机制。
自动化 Moonwell 协议治理提案生命周期,从创建、验证到部署与测试。
根据 Anthropic 最佳实践创建与管理 Claude Code 技能,包含触发条件、Hook 机制与渐进式披露。