shift-right-testing
生产环境测试策略,包含功能标志、金丝雀部署、合成监控与混沌工程,确保线上系统的持续可靠性。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 154 个技能
生产环境测试策略,包含功能标志、金丝雀部署、合成监控与混沌工程,确保线上系统的持续可靠性。
构建并编排从数据准备、模型训练、验证到自动化部署的端到端 MLOps 管线。
用于部署、管理和监控 DataRobot 模型的工具,包含预测环境配置、冠军/挑战者模型工作流程以及部署操作。
使用 Stable Baselines3 进行生产级强化学习。通过类 scikit-learn API 训练智能体、设计自定义环境、实现训练回调函数并优化工作流程。
通过 MCP 将您的 AI 代理连接至 Hugging Face Hub。搜索模型、数据集与论文,管理存储库,执行云端计算任务,并将 Gradio Spaces 作为 AI 工具调用使用。
PyTorch Lightning 深度学习框架技能:自动化模型训练、多 GPU 编排、数据管道以及 DDP、FSDP 和 DeepSpeed 等分布式训练策略。
世界级资深数据工程技能,用于构建可扩展的数据管道、ETL/ELT 系统及现代化数据基础设施,精通 Python、Spark、dbt 与 Kafka。
一套将实验性机器学习原型转换为稳健、可发布 Python 软件包的框架,采用 src 布局、混合架构与严谨的配置管理。
端到端自动化研究代理:从想法生成、文献综述到实验执行、对抗式审阅循环与论文撰写。
为 NVIDIA GPU 加速的分布式应用程序提供弹性、健康监控与容错工具,包含进程管理与 API 密钥处理功能。
FeatBit OpenTelemetry 可观测性集成专家指南。适用于设置指标、日志、追踪以及连接 OTEL 后端(如 Seq、Jaeger、Prometheus),以监控 FeatBit 后端服务性能。
使用 Flow Nexus 平台在分布式 E2B 沙盒中训练与管理神经网络,支持 Transformer、LSTM 和 GAN 等自定义架构。