MLOps Industrialization
一套将实验性机器学习原型转换为稳健、可发布 Python 软件包的框架,采用 src 布局、混合架构与严谨的配置管理。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 149 个技能
一套将实验性机器学习原型转换为稳健、可发布 Python 软件包的框架,采用 src 布局、混合架构与严谨的配置管理。
构建并编排从数据准备、模型训练、验证到自动化部署的端到端 MLOps 管线。
用于部署、管理和监控 DataRobot 模型的工具,包含预测环境配置、冠军/挑战者模型工作流程以及部署操作。
使用 Flow Nexus 平台在分布式 E2B 沙盒中训练与管理神经网络,支持 Transformer、LSTM 和 GAN 等自定义架构。
生产环境测试策略,包含功能标志、金丝雀部署、合成监控与混沌工程,确保线上系统的持续可靠性。
一套管理 LLM 项目生命周期的框架,涵盖评估任务模型契合度、架构设计、结构化输出解析及代理辅助开发流程。
基于 Apple Silicon 与 MLX 的本地机器学习推理服务,整合语音识别 (ASR)、语音合成 (TTS)、翻译、图像生成与视觉识别功能。
世界级资深数据工程技能,用于构建可扩展的数据管道、ETL/ELT 系统及现代化数据基础设施,精通 Python、Spark、dbt 与 Kafka。
高级测试报告与质量仪表板,提供 QE 指标、代码覆盖率与部署就绪度分析,通过预测性洞察协助团队进行数据驱动的质量决策。
为 NVIDIA GPU 加速的分布式应用程序提供弹性、健康监控与容错工具,包含进程管理与 API 密钥处理功能。
用于在 Claude Code 和 Gemini CLI 扩展之间转换及同步 AI 代理技能的通用 CLI 工具。
PyTorch Lightning 深度学习框架技能:自动化模型训练、多 GPU 编排、数据管道以及 DDP、FSDP 和 DeepSpeed 等分布式训练策略。