pytorch-lightning
PyTorch Lightning 深度学习框架技能:自动化模型训练、多 GPU 编排、数据管道以及 DDP、FSDP 和 DeepSpeed 等分布式训练策略。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 138 个技能
PyTorch Lightning 深度学习框架技能:自动化模型训练、多 GPU 编排、数据管道以及 DDP、FSDP 和 DeepSpeed 等分布式训练策略。
根据 PyTorch 惯例与 Sphinx 格式,自动生成或更新函数与方法的 docstring 文件说明。
AReaL 分布式训练调试指南,涵盖 FSDP2/TP/CP/EP 环境下的挂起、NCCL 错误、显存溢出与数值一致性问题。
使用 Stable Baselines3 进行生产级强化学习。通过类 scikit-learn API 训练智能体、设计自定义环境、实现训练回调函数并优化工作流程。
使用 FlashInfer API 日志功能排查与解决 CUDA 运行时崩溃的教学指南。
使用 Flow Nexus 平台在分布式 E2B 沙盒中训练与管理神经网络,支持 Transformer、LSTM 和 GAN 等自定义架构。
LangGraph 专家技能,专为构建具状态、多角色 AI 代理工作流而设计,包含持久化、条件分支与 ReAct 模式。
为 NVIDIA GPU 加速的分布式应用程序提供弹性、健康监控与容错工具,包含进程管理与 API 密钥处理功能。
Three.js 几何图形生成:内置形状、BufferGeometry、顶点操作、自定义网格,以及性能优化的实例化渲染。
Python 编程助手,提供最佳实践、PEP 8 代码规范检查、使用 pytest 的自动化测试以及基于 uv 的依赖管理。
ManimGL (3Blue1Brown OpenGL 动画引擎) 的最佳实践与代码模版。提供 3D 与交互场景开发、摄像机控制、以及 LaTeX 数学可视化指南,专为技术创作者设计。
全方位 Python 医疗 AI 工具包,用于临床数据处理、医学编码转换,以及开发用于 EHR、生理信号和临床预测任务的深度学习模型(如 RETAIN 与 Transformer)。