工程开发数据分析自动化
trulens-evaluation-workflow
使用 TruLens 对 LLM 应用程序进行检测、评估与监控的系统化工作流程,支持 LangChain、LangGraph 与 LlamaIndex 等框架。
浏览: 11★ 3,286#trulens#llm#evaluation#workflow
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 133 个技能
使用 TruLens 对 LLM 应用程序进行检测、评估与监控的系统化工作流程,支持 LangChain、LangGraph 与 LlamaIndex 等框架。
通过静态与动态分析检测密码学代码中的时间侧通道漏洞,支持多种编程语言。
生产级监控系统,包含 Prometheus 指标、Grafana 仪表板、PromQL 查询语言、告警规则与 AI 异常检测,适用于云原生应用。
实现 Linkerd 服务网格模式,用于 Kubernetes 环境中的安全性、流量策略管理与零信任网络部署。
基于 LSP 的符号级代码理解与导航工具,支持 30 多种编程语言,提供精准的符号查询、引用追踪与代码重构能力。
一套严格的四阶段方法论,强制要求在应用任何代码修复前,必须先进行系统性的根本原因分析。
用于 AI 代理的并行任务编排 CLI,采用隔离的 Git 工作区。
开发周期 Gate 2 技能,用于验证可观测性实现,包含结构化日志、OpenTelemetry 追踪及仪表覆盖率,且不修改代码。
诊断并调试代理间 (A2A) 通讯问题,涵盖编排器路由、传输连接、代理状态及多代理系统日志分析。
跨语言调试框架:包含科学调试法、堆栈追踪分析、日志记录策略,以及 Git bisect 与小黄鸭调试法等进阶技巧。
Claude Code 开发会话的自动化运行时可观测变更日志,追踪文件变更、测试结果与 Git 提交。
分析与调试 fast-agent 会话记录、工具执行日志与对话时序,以解决性能瓶颈、工具循环以及非预期的会话终止问题。