Prhub

#21807 [NPU] update ascend docs

原始 PR 作者 amote-i 合并时间 2026-04-01 17:14 文件变更 3 提交数 2 评论 2 代码增减 +91 / -10

执行摘要

更新 Ascend NPU 文档,移除已弃用参数并添加 Qwen3-235B 模型长序列示例。

根据PR body,动机是:1. 移除已弃用的参数用法;2. 为Qwen3-235B-A22B模型添加256K长序列的示例。

对于使用Ascend NPU平台的开发者,建议关注新增的Qwen3-235B长序列示例,以获取最新配置实践。PR本身为文档更新,无需代码审查,但文档变更值得验证以确保内容准确。

讨论亮点

Review过程中无实质性讨论,仅有sglang-npu-bot的自动化批准,表明变更被直接接受。

实现拆解

修改涉及三个文档文件:在ascend_npu_best_practice.md和ascend_npu_deepseek_example.md中删除了export SGLANG_DP_ROUND_ROBIN=1的引用;在ascend_npu_qwen3_examples.md中添加了Qwen3-235B-A22B-Instruct-2507模型在2个Atlas 800I A3节点上运行256K长序列的配置步骤,包括预填充节点、解码节点和路由器的环境变量和启动命令。

文件 模块 状态 重要度
docs/platforms/ascend/ascend_npu_best_practice.md documentation modified 3.0
docs/platforms/ascend/ascend_npu_deepseek_example.md documentation modified 2.0
docs/platforms/ascend/ascend_npu_qwen3_examples.md documentation modified 4.0

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

风险较低,主要在于文档准确性。移除已弃用参数可能影响仍在使用这些参数的老用户,但这是必要的文档清理。新增示例需要确保配置命令和环境变量正确无误,避免误导用户导致部署失败。

影响范围限于Ascend NPU平台的用户文档。移除已弃用参数提升文档的清晰度和准确性;新增示例扩展了文档的覆盖范围,支持用户在更复杂的场景下配置模型,如长序列推理。

文档内容过时风险 配置示例准确性

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

执行摘要

本次PR更新了Ascend NPU平台的文档,移除了已弃用参数并添加了Qwen3-235B模型在256K长序列上的运行示例,旨在提升文档准确性和覆盖范围。

功能与动机

PR的动机是清理文档中已弃用的参数用法,并扩展文档以支持新模型和场景。具体来说:

  • 移除已弃用的SGLANG_DP_ROUND_ROBIN等参数引用,避免用户配置错误。
  • 为Qwen3-235B-A22B模型添加在256K长序列上运行的详细示例,帮助用户部署复杂推理任务。

实现拆解

实现涉及三个文档文件的修改:

  1. ascend_npu_best_practice.md:移除了多处export SGLANG_DP_ROUND_ROBIN=1的引用。
  2. ascend_npu_deepseek_example.md:类似地移除了该参数的引用。
  3. ascend_npu_qwen3_examples.md:新增了以下内容:
    • 环境变量设置,如ASCEND_USE_FIA=1等。
    • 预填充节点、解码节点和路由器的详细启动命令,支持Qwen3-235B-A22B模型在2个Atlas 800I A3节点上运行256K长序列。

评论区精华

Review过程中没有实质性讨论,仅有sglang-npu-bot的自动化批准,表明变更被直接接受。

风险与影响

  • 风险:文档准确性是主要风险点。移除已弃用参数可能影响依赖这些参数的老用户,但鉴于参数已弃用,这是必要的清理。新增示例需要确保配置正确,避免误导用户。
  • 影响:影响范围限于Ascend NPU平台的用户文档。移除已弃用参数提升文档清晰度;新增示例扩展了文档覆盖,支持更复杂的部署场景。

关联脉络

从历史PR看,本次文档更新与涉及Ascend NPU平台的代码变更(如#17122)相关,但属于独立的文档维护工作,无直接代码关联。

参与讨论