debug-distributed
AReaL 分布式训练调试指南,涵盖 FSDP2/TP/CP/EP 环境下的挂起、NCCL 错误、显存溢出与数值一致性问题。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 148 个技能
AReaL 分布式训练调试指南,涵盖 FSDP2/TP/CP/EP 环境下的挂起、NCCL 错误、显存溢出与数值一致性问题。
基于 ANP 协议的跨 Agent 调用技能。利用去中心化身份 (DID) 在 ANP 网络中发现并调用各类远程 Agent,涵盖地图搜索、酒店预订、快递查询及路线规划等实用功能。
为数据表格设计并实现专业、交互式的筛选用户界面,并能根据列数据类型自动调整。
LangGraph 专家技能,专为构建具状态、多角色 AI 代理工作流而设计,包含持久化、条件分支与 ReAct 模式。
专注于 Trigger.dev 背景任务与 AI 工作流的专家助手,协助开发、设计与优化高可靠性的异步 TypeScript 任务架构。
撰写 NSF、NIH、DOE、DARPA 和台湾国科会 (NSTC) 的竞争性研究计划书。涵盖机构特定规范、预算规划、科学示意图生成及合规性审查。
通过将独立的调试或开发任务委派给具备独立上下文的专职子代理,实现并行化执行。
使用 rclone 在本地存储与云端服务商(如 S3、Cloudflare R2、Backblaze B2、Google Drive 和 Dropbox)之间管理、同步与传输文件。
使用 Mighty (mt) 任务进行代码开发管理,包含进度追踪、证据链接、设计决策记录以及标准化的任务结案流程。
通过 OpenAI Codex CLI 委派编码任务,适用于功能开发、重构、PR 审查及 Git 仓库中的自动化问题修复。
编排 Codex CLI 以实现高效并行程序开发、自动化任务与会话管理,优化 Token 使用量并提升开发效率。
为 pandas/polars/PySpark 生成数据清洗管道,处理缺失值、重复项、异常值、类型转换及数据验证。