debug-distributed
AReaL 分散式訓練除錯指南,涵蓋 FSDP2/TP/CP/EP 環境下的掛起、NCCL 錯誤、記憶體不足與數值一致性問題。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 250 個技能
AReaL 分散式訓練除錯指南,涵蓋 FSDP2/TP/CP/EP 環境下的掛起、NCCL 錯誤、記憶體不足與數值一致性問題。
使用 uv 管理 Python 環境與套件。提供快速、現代化的專案設定、相依性管理、指令碼執行與工具安裝指引,作為 pip、virtualenv 與 poetry 的極速替代方案。
建立、管理與除錯 dlt (data load tool) 資料管線,將資料從 API、資料庫及自訂來源匯入 DuckDB、BigQuery 或 Snowflake 等目標。
透過分析可用技能、制定結構化執行計畫並管理手動或委派的多步驟工作流程,來統籌複雜的程式設計任務。
透過基於協議的行為治理,協調 Claude Code 並行工作集群,以執行複雜功能開發、多步驟重構及長時間運行的自動化編程任務。
管理 SignalRoom 行銷平台的 dlt 資料管線與 Temporal 工作流。支援同步 Everflow、Redtrack 與 S3 資料至 Postgres,並執行狀態檢查與除錯。
NestJS 11+ 企業級 Node.js 開發專家,涵蓋依賴注入、DTO 驗證、身份驗證、ORM、測試、微服務及架構最佳實踐。
基於 Google A2A 協議的多代理協作框架。實現了基於 CLI 的 AI 工具間的訊息傳遞、任務委派與自動化協調。
為 Claude Code 設計的巢狀插件架構,透過動態載入 Playbooks、Skills 與 Agents,有效節省超過 90% 的上下文標記空間。
Claude Code 的自動工具與 MCP 伺服器探索。平行搜尋 17 個以上資源庫,在規劃前或發生錯誤時自動尋找相關技能、插件與工具。
自動化 Python 虛擬環境管理器,用於專案隔離、依賴管理與生命週期驗證。
一個模組化的數據處理工具,用於清理、驗證和分析 CSV 檔案,支援自定義轉換及自動化依賴管理。