#6004 [doc] feat: move msprobe to ascend_tutorial
作者 tardis-key · 合并时间 2026-04-14 16:53
将 PrecisionDebugger 文档移动到 ascend_tutorial 目录并简化配置示例。
该 PR 变更简单,主要涉及文档整理,无需深入精读。建议关注配置简化的合理性,并确认 summary_mode 变更是否与近期 PR(如 #5986)的 PrecisionDebugger 改进一致。
标签列表
聚合结果
作者 tardis-key · 合并时间 2026-04-14 16:53
将 PrecisionDebugger 文档移动到 ascend_tutorial 目录并简化配置示例。
该 PR 变更简单,主要涉及文档整理,无需深入精读。建议关注配置简化的合理性,并确认 summary_mode 变更是否与近期 PR(如 #5986)的 PrecisionDebugger 改进一致。
作者 Tjh-UKN · 合并时间 2026-04-14 15:52
简化 PrecisionDebugger 配置,统一使用全局 profiler 控制步骤和保存路径。
该 PR 值得精读,重点关注配置简化设计如何统一 profiler 控制。推荐关注 PrecisionDebuggerToolConfig 类的变更和 PrecisionDebuggerProfiler 中路径与步骤逻辑的调整,这些是核心设计决策。对于使用 msprobe 的工程师,应仔细阅读更新后的文档以适应新配置方式。
作者 sophiayyya · 合并时间 2026-04-14 14:20
将低精度训练文档(FP8和NVFP4 QAT)从advance目录移动到新建的low_precision子目录。
这是一个简单的文档重构PR,无需深入阅读代码。对于文档维护者,值得关注的是文档组织结构化的思路——将相关主题文档集中管理。对于开发者,可以快速浏览以了解低精度训练文档的新位置。
作者 zjchenn · 合并时间 2026-04-13 16:01
为NPU硬件新增RLOO优势估计器训练示例脚本,并合并到现有GPU脚本中。
该PR值得NPU用户或需要参考RLOO配置的工程师浏览,重点关注设备参数化设计和NPU特定覆盖的实现方式。对于技术管理者,可关注团队如何通过review优化硬件兼容性和验证频率,体现了对用户体验的考量。
作者 fh188 · 合并时间 2026-04-08 17:29
修复 Ascend 教程文档中的拼写、链接和 shell 语法错误。
对于技术管理者,此 PR 可快速批准以保持文档健康;对于工程师,建议关注 shell 命令修正部分(如反斜杠使用),避免在类似文档中重复错误,并以此为契机审查其他文档的语法。
作者 Tjh-UKN · 合并时间 2026-04-03 16:55
集成msprobe精度调试工具到VERL统一性能分析系统,支持Ascend训练侧数据收集。
建议技术管理者和工程师精读此PR,重点关注其如何将外部工具集成到统一分析器框架的设计决策,特别是阶段映射、模型解析和开销管理。值得关注`PrecisionDebuggerProfiler`类的实现和配置统一化方式,可作为类似集成的参考模板。
作者 zhangyimi · 合并时间 2026-04-03 14:10
新增NVFP4量化感知训练文档,涵盖FSDP和Megatron后端的配置说明。
该PR值得快速浏览以了解NVFP4 QAT的配置概览,但文档中的两个未解决问题需要后续跟进。建议关注quantization_config_path参数的实际使用情况和模型名称的准确性,以确保文档与代码实现一致。
作者 hustmf · 合并时间 2026-04-03 10:13
添加NPU常见问题解答文档,覆盖环境配置、调试和错误处理。
建议快速浏览以了解NPU常见问题,重点关注review中指出的配置键部分,实际使用时参考'reviewer建议'或配置文件'verl/trainer/config/npu_profile/npu_profile.yaml'。文档本身无需深入代码精读。