debug-distributed
AReaL 分布式训练调试指南,涵盖 FSDP2/TP/CP/EP 环境下的挂起、NCCL 错误、显存溢出与数值一致性问题。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 529 个技能
AReaL 分布式训练调试指南,涵盖 FSDP2/TP/CP/EP 环境下的挂起、NCCL 错误、显存溢出与数值一致性问题。
使用 Tavily API 进行即时网页搜索与内容提取的工具,适用于研究、信息收集与获取最新网络信息。
使用结构化 JSON 提示词与自动化 Python 脚本生成高质量的图像、角色与场景,支持参考图像以进行精确的视觉创作。
创建、调试并优化 Cloudflare Durable Objects。支持状态协调、RPC、SQLite 存储、WebSocket 处理程序以及 Vitest 测试。
用于可靠、多目标事件传递的开源基础设施。将 Webhook 路由至 HTTP、SQS、RabbitMQ、Pub/Sub、EventBridge 或 Kafka,并提供内置重试与可观测性功能。
分析 Claude Code 聊天记录以识别编程模式与技能差距,从 HackerNews 精选个性化学习资源,并将成长报告发送至 Slack。
分析公开 LinkedIn 个人档案与商业数据,建立精准潜在客户名单,协助识别决策者、追踪职业变动并强化业务开发资料。
自动化将旧版单文件任务迁移至结构化文件夹系统的工具,以提升项目组织效率。
将系统内核与对手战术研究合成为具体且可验证的威胁狩猎假设。
专为 morphir-dotnet 设计的专业 QA 测试代理,涵盖测试计划、回归测试、端到端验证、错误报告及套件验证。
针对 Go CLI 应用程序的专家级自动化代码审查,涵盖 Cobra/urfave 模式、安全性、性能、Go 惯用语法及完善的错误处理。
用于模型上下文协议 (MCP) 的命令行接口,可直接在终端中探索、检查并执行来自 MCP 服务器的工具。