pytorch-lightning
PyTorch Lightning 深度學習框架技能:自動化模型訓練、多 GPU 編排、數據管道以及 DDP、FSDP 和 DeepSpeed 等分散式訓練策略。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 130 個技能
PyTorch Lightning 深度學習框架技能:自動化模型訓練、多 GPU 編排、數據管道以及 DDP、FSDP 和 DeepSpeed 等分散式訓練策略。
AReaL 分散式訓練除錯指南,涵蓋 FSDP2/TP/CP/EP 環境下的掛起、NCCL 錯誤、記憶體不足與數值一致性問題。
使用 Flow Nexus 平台在分佈式 E2B 沙盒中訓練與管理神經網路,支援 Transformer、LSTM 和 GAN 等自定義架構。
為 NVIDIA GPU 加速的分散式應用程式提供彈性、健康監控與容錯工具,包含進程管理與 API 金鑰處理功能。
使用 Cloudflare Agents SDK 在 Workers 上構建有狀態的 AI 代理。支援實時 WebSocket、持久化狀態管理、定時背景任務與工具整合,專為生產環境設計。
使用 Stable Baselines3 進行生產級強化學習。透過類 scikit-learn API 訓練智能體、設計自定義環境、實作訓練回調函數並優化工作流程。
使用 agentic-flow 編排多代理群體,支援平行任務執行、動態拓撲與智慧協調。適用於構建分散式 AI 系統與擴展複雜的開發工作流程。
架構多代理系統以突破上下文限制,運用監督者、群體與分層模型等模式來管理複雜工作流程。
透過將獨立的除錯或開發任務委派給具備獨立上下文的專職子代理,實現並行化執行。
為研究、開發與測試工作流部署網格、層級與星狀拓撲等進階多代理人蜂群編排策略。
透過協調多個專業 AI 代理來執行複雜工作流,實現多角度代碼分析、功能開發與系統級審查的自動化編排。
P9 技術領隊模式:透過任務提示(六要素)管理 P8 代理團隊,無需親自撰寫程式碼。負責專案管理、任務拆解,並協調 3 個以上平行代理執行任務。