trulens-evaluation-workflow
使用 TruLens 对 LLM 应用程序进行检测、评估与监控的系统化工作流程,支持 LangChain、LangGraph 与 LlamaIndex 等框架。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 260 个技能
使用 TruLens 对 LLM 应用程序进行检测、评估与监控的系统化工作流程,支持 LangChain、LangGraph 与 LlamaIndex 等框架。
自动化质量闸门,使用 5 个并行 AI 代理审查代码变更,确保正确性、风格与一致性。
Epsimo AI 平台开发套件与 CLI,支持构建具有持久化状态、虚拟数据库、流式对话及 React UI 套件的智能体。
MERIDIAN 自主 AI 代理实现模式,包含 BaseAgent 生命周期、Claude API 结构化工具调用、Token 配额管理与 cron 调度系统。
严格的测试驱动开发 (TDD) 工作流技能,强制执行测试优先原则,确保新功能、修复与重构的单元、集成及 E2E 测试覆盖率达 80% 以上。
一个 AI 驱动的框架,用于从零开始打造独特且真实的个人作品集网站。引导 AI 代理完成研究、设计与实施,构建具备个人特色的专业网站。
利用风险评估与优先级排序,将测试重点集中在最高风险区域。适用于规划测试策略、配置测试资源或进行覆盖率决策。
为 AI 代理生成完整的 Taskery 本地 Kanban 看板操作指南,涵盖 CLI、API 及并发控制管理。
克劳德代码会话的正式评估框架,实施评估驱动开发(EDD)原则,用于保障 AI 代理的可靠性。
全方位的社交媒体营销活动分析工具,提供绩效追踪、投资回报率 (ROI) 计算、受众洞察以及可行的营销优化建议。
掌握伦敦派(模拟测试)与芝加哥派(状态测试)TDD。通过 AI 代理自动化测试驱动开发流程、风格选择与代码重构。
根据网址生成专业的全平台广告活动。获取广告文案、受众定向、创意规格与预算策略,可直接用于媒体购买与投放。