debug-distributed
AReaL 分布式训练调试指南,涵盖 FSDP2/TP/CP/EP 环境下的挂起、NCCL 错误、显存溢出与数值一致性问题。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 381 个技能
AReaL 分布式训练调试指南,涵盖 FSDP2/TP/CP/EP 环境下的挂起、NCCL 错误、显存溢出与数值一致性问题。
打造价值 $50,000 美元级别的专业前端界面,提供生产级代码、精选排版与高质量影像素材整合。
使用 Cloudflare Agents SDK 在 Workers 上构建有状态的 AI 代理。支持实时 WebSocket、持久化状态管理、定时后台任务与工具集成,专为生产环境设计。
应用务实编码标准:包含明确命名、单一职责函数、防御性编程,以及确定性副作用,拒绝过度设计与臆测性功能。
视频内容全链路处理流水线,将原始录影自动转化为逐字稿、观点摘要、短视频切片及可发布文章。
一个多范式 ETL 流水线代理,支持批处理和流式数据处理、自动模式推断及基于 DAG 的可配置转换,适用于异构数据源。
世界级资深数据工程技能,用于构建可扩展的数据管道、ETL/ELT 系统及现代化数据基础设施,精通 Python、Spark、dbt 与 Kafka。
Claude Code 的自主多智能体协调框架,具备记忆驱动工作流程、优先并行执行、基于亚里士多德原则的拆解与多阶段质量把关。
专为构建与管理 Next.js App Router API 路由设计的技能,支持处理 HTTP 方法、请求主体、流式传输与响应配置。
Claude Skills 安全扫描工具,用于在安装前检测恶意代码、数据泄露风险及未经授权的系统访问,确保环境安全。
全栈软件开发生命周期 (SDLC) 代理工作流程,利用 MCP 工具管理从需求导入、规划到自动化测试、CI/CD 与基础设施部署的完整生产周期。
将您的代码库、提示词和 API 调用从 Claude Sonnet 4.0/4.5 或 Opus 4.1 迁移至 Opus 4.5,并自动调整相关设置。