Prhub

#23459 [NPU] [DOC] Update Ascend NPU best practice

原始 PR 作者 amote-i 合并时间 2026-04-22 17:51 文件变更 1 提交数 2 评论 2 代码增减 +8 / -9

执行摘要

更新 Ascend NPU 最佳实践文档,调整 Qwen3-Next 配置为单卡

根据PR描述,目的是更新Ascend NPU最佳实践文档,反映Qwen3-Next模型在单卡环境下的最新测试结果和推荐配置。

该PR为纯文档更新,技术含量低,不值得精读。但可关注其中关于单卡配置的推荐,为Ascend NPU用户提供参考。

讨论亮点

gemini-code-assist[bot] 提出了两个关于单复数一致性的评论:

  1. 在锚点链接中,"1-cards"应改为"1-card"以保持语法正确。
  2. 在章节标题中,"1 Cards"应改为"1 Card"。
    这两个问题均未被采纳或回复,但属于轻微语法问题,不影响功能。

实现拆解

  1. 在硬件配置表中,将Qwen3-Next-A3B-Instruct的推荐卡数从"2"改为"1",并更新对应的锚点链接从"a3-2-cards-mixed-mode"为"a3-1-cards-mixed-mode"。
  2. 更新了Qwen3-Next的基准测试命令参数:将--max-concurrency从768改为1024,--random-input-len从3500改为3584,--random-output-len从1500改为1536,--num-prompts从3072改为7168,--request-rate从16改为40。
  3. 在文档尾部,将"Qwen3-Next 3_5K-1_5K 20ms on A3 2 Cards Mixed Mode"章节标题更新为"1 Cards Mixed Mode",并相应修改硬件描述和启动命令参数:将--tp-size从4改为2,--dp-size从2删除,以及调整--enable-dp-attention等标志。
文件 模块 状态 重要度
docs_new/docs/hardware-platforms/ascend-npus/ascend_npu_best_practice.mdx 文档 modified 2.94

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

锚点链接中 "cards" 单复数不一致 style

gemini-code-assist[bot] 指出锚点链接使用复数 "cards" 但对应单卡配置,建议改为 "1-card"。

结论:未回复,但该建议合理,应在后续修复。 · unresolved

章节标题中 "1 Cards" 语法错误 style

gemini-code-assist[bot] 指出章节标题中 "1 Cards" 应改为 "1 Card"。

结论:未回复,但该建议合理,应在后续修复。 · unresolved

风险与影响

该PR仅修改文档内容,无代码变更,因此技术风险极低。主要风险是文档中的配置信息可能不准确,或与用户实际环境不匹配,但鉴于这是最佳实践文档,风险可控。

影响范围仅限于文档读者,特别是使用Ascend NPU部署Qwen3-Next模型的用户。影响程度较低,因为只是更新了推荐配置,不会影响系统功能。

文档内容可能不准确 语法错误未修复

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论