工程開發
debug-distributed
AReaL 分散式訓練除錯指南,涵蓋 FSDP2/TP/CP/EP 環境下的掛起、NCCL 錯誤、記憶體不足與數值一致性問題。
瀏覽: 4★ 5,126
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 226 個技能
AReaL 分散式訓練除錯指南,涵蓋 FSDP2/TP/CP/EP 環境下的掛起、NCCL 錯誤、記憶體不足與數值一致性問題。
使用 validate_skills.py 驗證 Skills、Agents 與 Commands 的語法,記錄錯誤並管理代理開發的自動化質量控制流程。
透過遞迴分塊、子查詢與聚合結果處理超過 1,000 萬 tokens 的大型檔案與程式碼庫,突破 LLM 上下文視窗限制。
產生有限差分模板,選擇PDE/ODE數值離散化方案,並執行截斷誤差分析以提升模擬精確度。
使用 AgentDB 的超快速向量後端實作 ReasoningBank 自適應學習。具備軌跡追蹤、判斷評估、記憶蒸餾與模式識別功能,適用於構建自我學習的自主智能體。
為技術架構、複雜重構與結構化除錯提供多視角 AI 諮詢服務。
從您的代碼庫和技術規範中生成全面的 API 參考、用戶手冊和系統架構文檔。
使用 Tesseract OCR 引擎從圖片中提取文字,支援多種語言、影像預處理以及多種輸出格式。
使用 LangChain 1.x 與 LangGraph 架構生產級 LLM 應用程式。實現狀態化 AI 代理、多步驟工作流程,並為複雜的對話與自動化任務建構自訂記憶系統。
從零開始構建、配置與部署 NexAU Agent 的完整指南與開發框架,包含工具、提示詞與技能實現。
生產級監控系統,包含 Prometheus 指標、Grafana 儀表板、PromQL 查詢語言、告警規則與 AI 異常偵測,適用於雲原生應用。
自動化 API 文件引擎,可根據程式碼變更自動生成並更新 OpenAPI 規格與 Markdown 文件。