Prhub

#22307 fix issues for npu docs

原始 PR 作者 amote-i 合并时间 2026-04-09 16:27 文件变更 4 提交数 3 评论 3 代码增减 +12 / -10

执行摘要

更新 NPU 平台文档,修正参数描述和版本信息。

根据 PR body 的描述,本次变更的动机是:

  1. 为参数添加更清晰的选项描述;
  2. 更新新的参数。具体体现在文档中,例如为 --ep-dispatch-algorithm--expert-distribution-recorder-mode 等参数补充了可选的枚举值,并修正了 --moe-dense-tp-size 的默认值描述。

对于大多数工程师,无需精读此 PR。建议 NPU 平台的用户或负责 NPU 相关开发的工程师快速浏览 ascend_npu_support_features.md 的变更,以了解参数选项的更新和功能限制的澄清。重点关注参数默认值和可选值的更新,确保与自己的使用场景一致。

讨论亮点

本次 PR 没有实质性的 review 评论。唯一的 review 是由 sglang-npu-bot 自动批准的,没有提供具体讨论内容。Issue 评论中仅有机器人关于配额限制的警告和触发 CI 的命令。因此,没有关于设计权衡、争议或未解决疑虑的讨论。

实现拆解

本次变更涉及 4 个文档文件,均为 Ascend NPU 平台相关文档:

  1. ascend_contribution_guide.md: 修正了代码块格式(将 ``python 改为python`)。
  2. ascend_npu.md: 将 CANN 版本号从 8.3.RC2 更新至 8.5.0,并更新了对应的安装指南链接。
  3. ascend_npu_quantization.md: 修正了关于 MoE 混合比特量化的描述语句,移除了多余的括号。
  4. ascend_npu_support_features.md: 进行了多处更新,包括:为 --pp-size 添加了当前不支持 2 的说明;新增了 --enable-lora-overlap-loading 参数;为 --ep-dispatch-algorithm--eplb-algorithm--expert-distribution-recorder-mode 等参数补充了具体的可选值;更新了 --moe-dense-tp-size 的默认值描述。
文件 模块 状态 重要度
docs/platforms/ascend/ascend_npu_support_features.md documentation/ascend modified 3.0
docs/platforms/ascend/ascend_npu.md documentation/ascend modified 2.0
docs/platforms/ascend/ascend_npu_quantization.md documentation/ascend modified 1.0
docs/platforms/ascend/ascend_contribution_guide.md documentation/ascend modified 1.0

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

风险极低。本次变更仅限于文档内容,不涉及任何代码逻辑、配置或运行时行为。主要风险在于文档更新的准确性:

  1. 版本号更新(如 CANN 8.5.0)需要与实际支持的版本一致,否则可能误导用户。
  2. 参数选项的补充(如 --ep-dispatch-algorithmstatic, dynamic, fake)需要与代码实现的功能完全匹配。
  3. 功能支持表格的更新(如 --moe-dense-tp-size 的默认值改为 1)需要反映 NPU 平台的实际限制。
    由于没有代码变更,不存在回归、性能、安全或兼容性风险。

影响范围仅限于使用 Ascend NPU 平台的用户和开发者:

  1. 对用户:提供了更准确、更详细的参数配置指南,有助于减少配置错误和理解成本。例如,明确了 --pp-size 目前不支持 2,避免了无效尝试。
  2. 对系统:无直接影响,文档变更不改变系统行为。
  3. 对团队:提升了文档质量,有利于新成员快速上手 NPU 平台,并减少了因文档过时导致的支持请求。
    影响程度为低,属于常规的文档维护工作。
文档准确性风险

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论