shift-right-testing
生产环境测试策略,包含功能标志、金丝雀部署、合成监控与混沌工程,确保线上系统的持续可靠性。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 164 个技能
生产环境测试策略,包含功能标志、金丝雀部署、合成监控与混沌工程,确保线上系统的持续可靠性。
为构建 Claude API 生产级应用提供专家指导,涵盖 SDK 使用、提示词缓存、批量处理、流式传输、工具调用及成本优化策略。
世界级资深数据工程技能,用于构建可扩展的数据管道、ETL/ELT 系统及现代化数据基础设施,精通 Python、Spark、dbt 与 Kafka。
用于 LLM 后训练(SFT/DPO/RLHF)的高质量数据集策劃指南,涵盖数据格式、质量过滤与收集策略。
专为协调系统设计的决策代理,用于处理复杂的架构选择、任务规划与错误排除。
诊断、隔离并缓解 LLM 上下文故障(如中间丢失、中毒、干扰及冲突),提升 AI 代理的执行可靠性。
使用 Stable Baselines3 进行生产级强化学习。通过类 scikit-learn API 训练智能体、设计自定义环境、实现训练回调函数并优化工作流程。
AReaL 分布式训练调试指南,涵盖 FSDP2/TP/CP/EP 环境下的挂起、NCCL 错误、显存溢出与数值一致性问题。
根据实际工程经验撰写清晰、专业的技术文档、博客文章与教学指南,优先考虑价值传递与可执行的见解。
执行用户参与数据的同期群分析。识别留存趋势、功能采用率、流失模式,并透过定量数据分析生成可执行的研究建议。
Anthropic Claude 集成模式:流式传输、基于 pgvector 的 RAG、工具调用、模型选择(Haiku/Sonnet/Opus)、提示词缓存及 AI 工程成本管理。
使用 AgentDB 的超快速向量后端实现 ReasoningBank 自适应学习。具备轨迹追踪、判定评估、记忆蒸馏与模式识别功能,适用于构建自我学习的自主智能体。