工程开发数据分析自动化
trulens-evaluation-workflow
使用 TruLens 对 LLM 应用程序进行检测、评估与监控的系统化工作流程,支持 LangChain、LangGraph 与 LlamaIndex 等框架。
浏览: 11★ 3,286#trulens#llm#evaluation#workflow
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 292 个技能
使用 TruLens 对 LLM 应用程序进行检测、评估与监控的系统化工作流程,支持 LangChain、LangGraph 与 LlamaIndex 等框架。
通过公司专用的指南与模板,标准化您的内部沟通,涵盖报告、简报及项目更新等应用。
为技术架构、复杂重构与结构化调试提供多视角 AI 咨询服务。
Claude Code 项目启动工具,包含安全防护、Git 工作流程自动化、项目审计以及结构化多阶段规划。
一套专业工具集,用于在 Claude Code 环境中审核、评估、切分文档及构建生产级 RAG 管线。
为 Splitrail 实现新 AI 编程代理分析器的开发指南,用于追踪代码代理的 Token 使用量、成本及性能指标。
部署并管理 Railway 数据库服务(Postgres、Redis、MySQL、MongoDB),并提供自动化配置与环境变量连接。
为 AI 代理构建系统化的评估框架,利用多维评分标准、LLM-as-a-judge 与回归测试,量测代理效能、质量及上下文工程的有效性。
一套用于上下文工程、多代理架构及生产级代理系统优化的结构化代理技能集。
这是一个友好的欢迎技能,当用户发送“hello”或“hi”时,会以 ASCII 艺术风格显示操作系统信息。
通过价值、易用性、可行性与运营可行性四个维度,利用多角度批判性思维对现有产品功能进行风险假设评估与压力测试。
一套观点工程引擎,通过多代理研究与表达 DNA 分析,提取目标的思维框架并生成可执行的模拟人格技能。