工程开发
debug-distributed
AReaL 分布式训练调试指南,涵盖 FSDP2/TP/CP/EP 环境下的挂起、NCCL 错误、显存溢出与数值一致性问题。
浏览: 4★ 5,126
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 226 个技能
AReaL 分布式训练调试指南,涵盖 FSDP2/TP/CP/EP 环境下的挂起、NCCL 错误、显存溢出与数值一致性问题。
使用 validate_skills.py 验证 Skills、Agents 与 Commands 的语法,记录错误并管理代理开发中的自动化质量控制流程。
通过递归分块、子查询与聚合结果处理超过 1,000 万 token 的大型文件和代码库,突破 LLM 上下文窗口限制。
生成有限差分模板,选择PDE/ODE数值离散化方案,并执行截断误差分析以提升模拟精度。
使用 AgentDB 的超快速向量后端实现 ReasoningBank 自适应学习。具备轨迹追踪、判定评估、记忆蒸馏与模式识别功能,适用于构建自我学习的自主智能体。
为技术架构、复杂重构与结构化调试提供多视角 AI 咨询服务。
从您的代码库和技术规范中生成全面的 API 参考、用户手册和系统架构文档。
使用 Tesseract OCR 引擎从图片中提取文字,支持多种语言、图像预处理以及多种输出格式。
使用 LangChain 1.x 与 LangGraph 构建生产级 LLM 应用程序。实现状态化 AI 代理、多步骤工作流程,并为复杂的对话与自动化任务构建自定义记忆系统。
从零开始构建、配置与部署 NexAU Agent 的完整指南与开发框架,包含工具、提示词与技能实现。
生产级监控系统,包含 Prometheus 指标、Grafana 仪表板、PromQL 查询语言、告警规则与 AI 异常检测,适用于云原生应用。
自动化 API 文档引擎,可根据代码变更自动生成并更新 OpenAPI 规范与 Markdown 文档。