工程开发数据分析自动化
trulens-evaluation-workflow
使用 TruLens 对 LLM 应用程序进行检测、评估与监控的系统化工作流程,支持 LangChain、LangGraph 与 LlamaIndex 等框架。
浏览: 11★ 3,286#trulens#llm#evaluation#workflow
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 313 个技能
使用 TruLens 对 LLM 应用程序进行检测、评估与监控的系统化工作流程,支持 LangChain、LangGraph 与 LlamaIndex 等框架。
执行、调试与管理 DBHub 测试,包含单元测试、使用 Testcontainers 的集成测试及数据库专属测试。适用于验证代码变更与排查数据库连接器问题。
local-skills-mcp 仓库实现指南。提供关于 MCP 工具处理程序、技能加载与聚合逻辑,以及项目结构的详细技术文档,帮助开发者快速理解与开发。
用于控制 Bluesound 和 NAD 音频播放器的命令行界面,支持多房间播放、设备分组与音量管理。
管理 JUCE 插件的完整生命周期:安装、卸载、重置与彻底删除。专为音频开发者设计,处理系统文件夹部署、缓存管理以及具备备份机制的安全移除流程。
自动化建立隔离的 git worktree 环境,用于并行功能开发与环境设置。
用于执行网络渗透测试的专业框架,包含自动化信息收集、漏洞扫描与攻击利用流程。
强化版规划模式。通过结构化需求导入与具体技术方案选择,协助工程师在动手写代码前先建立产品思维。
AReaL 分布式训练调试指南,涵盖 FSDP2/TP/CP/EP 环境下的挂起、NCCL 错误、显存溢出与数值一致性问题。
使用 mise 管理项目依赖:新增、配置并排查工具版本、PATH 启动与配置文件问题。
自动化研究资源准备工作,包括加载实例、搜索 GitHub 代码库、构建数据集描述以及下载 arXiv 论文。
CMTAT RuleEngine 合约的 Foundry 开发指南,包含测试、部署脚本以及专案特定的 Solidity 模式。