Prhub
← 返回仓库详情

标签聚合

verl-project/verl · 标签视图

标签列表

聚合结果

doc 相关 PR

2026-04-14

#6004 [doc] feat: move msprobe to ascend_tutorial

作者 tardis-key · 合并时间 2026-04-14 16:53

文档 重要性 2.00 洞察度 2.00

将 PrecisionDebugger 文档移动到 ascend_tutorial 目录并简化配置示例。

doc npu perf

该 PR 变更简单,主要涉及文档整理,无需深入精读。建议关注配置简化的合理性,并确认 summary_mode 变更是否与近期 PR(如 #5986)的 PrecisionDebugger 改进一致。

#5986 [perf] feat: simplify precision_debugger config behavior and docs

作者 Tjh-UKN · 合并时间 2026-04-14 15:52

性能优化 重要性 6.00 洞察度 5.00

简化 PrecisionDebugger 配置,统一使用全局 profiler 控制步骤和保存路径。

perf doc trainer npu

该 PR 值得精读,重点关注配置简化设计如何统一 profiler 控制。推荐关注 PrecisionDebuggerToolConfig 类的变更和 PrecisionDebuggerProfiler 中路径与步骤逻辑的调整,这些是核心设计决策。对于使用 msprobe 的工程师,应仔细阅读更新后的文档以适应新配置方式。

#5994 [doc] fix: move low precision doc

作者 sophiayyya · 合并时间 2026-04-14 14:20

文档 重要性 2.00 洞察度 3.00

将低精度训练文档(FP8和NVFP4 QAT)从advance目录移动到新建的low_precision子目录。

doc misc trainer

这是一个简单的文档重构PR,无需深入阅读代码。对于文档维护者,值得关注的是文档组织结构化的思路——将相关主题文档集中管理。对于开发者,可以快速浏览以了解低精度训练文档的新位置。

2026-04-13

#5950 [doc] chore: add rloo advantage estimator example script for npu

作者 zjchenn · 合并时间 2026-04-13 16:01

文档 重要性 3.00 洞察度 4.00

为NPU硬件新增RLOO优势估计器训练示例脚本,并合并到现有GPU脚本中。

doc npu trainer examples

该PR值得NPU用户或需要参考RLOO配置的工程师浏览,重点关注设备参数化设计和NPU特定覆盖的实现方式。对于技术管理者,可关注团队如何通过review优化硬件兼容性和验证频率,体现了对用户体验的考量。

2026-04-08

#5913 [doc] fix: fix non‑compliant sections

作者 fh188 · 合并时间 2026-04-08 17:29

文档 重要性 3.00 洞察度 2.00

修复 Ascend 教程文档中的拼写、链接和 shell 语法错误。

doc npu misc

对于技术管理者,此 PR 可快速批准以保持文档健康;对于工程师,建议关注 shell 命令修正部分(如反斜杠使用),避免在类似文档中重复错误,并以此为契机审查其他文档的语法。

2026-04-03

#5186 [tool] feat: verl integrate msprobe data collection

作者 Tjh-UKN · 合并时间 2026-04-03 16:55

功能 重要性 7.00 洞察度 6.00

集成msprobe精度调试工具到VERL统一性能分析系统,支持Ascend训练侧数据收集。

tool perf npu trainer doc

建议技术管理者和工程师精读此PR,重点关注其如何将外部工具集成到统一分析器框架的设计决策,特别是阶段映射、模型解析和开销管理。值得关注`PrecisionDebuggerProfiler`类的实现和配置统一化方式,可作为类似集成的参考模板。

#5861 [doc] feat: add NVFP4 QAT documentation

作者 zhangyimi · 合并时间 2026-04-03 14:10

文档 重要性 3.00 洞察度 2.00

新增NVFP4量化感知训练文档,涵盖FSDP和Megatron后端的配置说明。

doc quantization megatron fsdp misc

该PR值得快速浏览以了解NVFP4 QAT的配置概览,但文档中的两个未解决问题需要后续跟进。建议关注quantization_config_path参数的实际使用情况和模型名称的准确性,以确保文档与代码实现一致。

#5871 [doc] chore: add npu faq doc

作者 hustmf · 合并时间 2026-04-03 10:13

文档 重要性 3.00 洞察度 2.00

添加NPU常见问题解答文档,覆盖环境配置、调试和错误处理。

doc npu misc

建议快速浏览以了解NPU常见问题,重点关注review中指出的配置键部分,实际使用时参考'reviewer建议'或配置文件'verl/trainer/config/npu_profile/npu_profile.yaml'。文档本身无需深入代码精读。