工程开发
debug-distributed
AReaL 分布式训练调试指南,涵盖 FSDP2/TP/CP/EP 环境下的挂起、NCCL 错误、显存溢出与数值一致性问题。
浏览: 4★ 5,126
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 132 个技能
AReaL 分布式训练调试指南,涵盖 FSDP2/TP/CP/EP 环境下的挂起、NCCL 错误、显存溢出与数值一致性问题。
端到端自动化研究代理:从想法生成、文献综述到实验执行、对抗式审阅循环与论文撰写。
生产环境测试策略,包含功能标志、金丝雀部署、合成监控与混沌工程,确保线上系统的持续可靠性。
将行为科学、心智模型和心理学原理应用于营销策略、文案撰写与决策分析。
获取 Y Combinator 443+ 份创业资源库,为您提供有关融资、联合创始人、产品开发、增长与企业扩张的专家级建议。
通过管理插件来自我修改 Milady 代理。编辑代码、重建并重新启动运行环境,以开发新功能或本地优化代理工作流程。
一套将实验性机器学习原型转换为稳健、可发布 Python 软件包的框架,采用 src 布局、混合架构与严谨的配置管理。
监控并管理保证金生活策略,追踪余额、利息成本与覆盖率。根据投资组合与保证金的安全阈值提供自动化扩展建议与安全警报。
使用 BigCode Evaluation Harness 评估代码生成模型。涵盖 HumanEval、MBPP 和 MultiPL-E 等基准测试,提供多语言编码模型的 pass@k 指标评估。
将气象与环境变量分类为驱动因素类别,以进行一致的归因分析与环境建模。
证据优先的文献收集工具,专为自动化研究管线设计。将论文池扩充至 1200 篇以上,具备元数据规范化、来源追溯及多路径导入功能。
为提示词中的 JSON 数据提供认知安全分析,防止大型语言模型在处理不完整或大规模数据集时产生幻觉与推理错误。