debug-distributed
AReaL 分散式訓練除錯指南,涵蓋 FSDP2/TP/CP/EP 環境下的掛起、NCCL 錯誤、記憶體不足與數值一致性問題。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 163 個技能
AReaL 分散式訓練除錯指南,涵蓋 FSDP2/TP/CP/EP 環境下的掛起、NCCL 錯誤、記憶體不足與數值一致性問題。
Litestream 災害復原工具的專家技術支援,涵蓋 WAL 監控、LTX 複製、雲端儲存後端以及 SQLite 頁面管理。
為事件溯源系統設計並實作強大且可擴展的事件儲存,涵蓋架構模式、技術選擇及持久化策略。
使用 agentic-flow 編排多代理群體,支援平行任務執行、動態拓撲與智慧協調。適用於構建分散式 AI 系統與擴展複雜的開發工作流程。
MERIDIAN 自主 AI 代理實作模式,包含 BaseAgent 生命週期、Claude API 結構化工具呼叫、Token 配額管理與 cron 排程系統。
lemline-core 開發指南。適用於無狀態 Serverless Workflow 引擎,涵蓋工作流執行、節點導航、狀態轉換、JQ 表達式評估、錯誤處理及並行分支邏輯。
使用 Cloudflare Agents SDK 在 Workers 上構建有狀態的 AI 代理。支援實時 WebSocket、持久化狀態管理、定時背景任務與工具整合,專為生產環境設計。
透過 SSE 協定直接連接 RagCode MCP,無需繁瑣的設定檔或二進位檔案依賴。
透過將獨立的除錯或開發任務委派給具備獨立上下文的專職子代理,實現並行化執行。
Arma Reforger EnforceScript 開發指南,涵蓋組件架構、網路同步、持久化存檔與記憶體管理。
Django Celery 非同步任務處理專家指南。提供任務設計、工作節點配置、錯誤處理、定期任務與生產環境監控的最佳實踐。
強制執行 UI 嚴格遵守專案設計系統的標記、元件與版面配置規範,以確保前端開發的一致性。