shift-right-testing
生产环境测试策略,包含功能标志、金丝雀部署、合成监控与混沌工程,确保线上系统的持续可靠性。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 152 个技能
生产环境测试策略,包含功能标志、金丝雀部署、合成监控与混沌工程,确保线上系统的持续可靠性。
PyTorch Lightning 深度学习框架技能:自动化模型训练、多 GPU 编排、数据管道以及 DDP、FSDP 和 DeepSpeed 等分布式训练策略。
恢复暂停的实验循环,通过还原分支内容、加载配置、读取结果历史记录及识别优化模式,协助您继续进行迭代与研究。
构建并编排从数据准备、模型训练、验证到自动化部署的端到端 MLOps 管线。
使用 Stable Baselines3 进行生产级强化学习。通过类 scikit-learn API 训练智能体、设计自定义环境、实现训练回调函数并优化工作流程。
AI 优化项目追踪系统,利用 YAML 与 Markdown 混合格式,实现高效率的项目编排、阶段管理与自动化任务委派,大幅降低 Token 消耗。
端到端自动化研究代理:从想法生成、文献综述到实验执行、对抗式审阅循环与论文撰写。
代码库自动化优化循环。根据特定目标与机械指标,自动修改、测量并迭代代码以提升效能。
用于部署、管理和监控 DataRobot 模型的工具,包含预测环境配置、冠军/挑战者模型工作流程以及部署操作。
MERIDIAN 自主 AI 代理实现模式,包含 BaseAgent 生命周期、Claude API 结构化工具调用、Token 配额管理与 cron 调度系统。
FeatBit OpenTelemetry 可观测性集成专家指南。适用于设置指标、日志、追踪以及连接 OTEL 后端(如 Seq、Jaeger、Prometheus),以监控 FeatBit 后端服务性能。
MassGen 自我开发指南,支持自动化测试与可视化 UI/UX 评估流程。