工程開發
debug-distributed
AReaL 分散式訓練除錯指南,涵蓋 FSDP2/TP/CP/EP 環境下的掛起、NCCL 錯誤、記憶體不足與數值一致性問題。
瀏覽: 4★ 5,126
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 128 個技能
AReaL 分散式訓練除錯指南,涵蓋 FSDP2/TP/CP/EP 環境下的掛起、NCCL 錯誤、記憶體不足與數值一致性問題。
用於構建健壯 AI Agent 技能的元技能,採用測試驅動開發 (TDD) 方法:定義失敗 (RED)、實作技能 (GREEN) 並修補合理化漏洞 (REFACTOR)。
提取並記錄真實的寫作語氣。為 AI 訓練、代筆寫作及品牌一致性建立詳盡的語氣指南。
將氣象與環境變數分類為驅動因素類別,以進行一致的歸因分析與環境建模。
全方位 Python 醫療 AI 工具包,用於臨床數據處理、醫學編碼轉換,以及開發用於 EHR、生理訊號和臨床預測任務的深度學習模型(如 RETAIN 與 Transformer)。
用於部署、管理和監控 DataRobot 模型的工具,包含預測環境配置、冠軍/挑戰者模型工作流程以及部署操作。
為初創企業構建 3-5 年財務模型,涵蓋收入預測、成本結構、現金流分析及情境規劃,支持募資與營運決策。
使用 Chrome DevTools MCP 和 AI 視覺模型進行 UI 測試、設計一致性驗證及瀏覽器除錯。
維護並更新 MassGen 模型註冊表,包含後端能力、模型元數據、定價結構以及新舊 AI 模型的上下文窗口配置。
基於 Notion 的推文效能追蹤系統,透過強化學習原理實現數據驅動的內容實驗與優化。
客戶問題與調查研究工具,提供多來源資訊整合、事件追蹤、帳戶歷史紀錄查詢,並包含來源標註與信賴度評分。
根據 litellm 註冊表審核並同步 assets.py 中的支援 LLM 模型列表。