Prhub

#26903 [NPU] [DOC] clarify Ascend NPU exclusive supported values for speculative args

原始 PR 作者 amote-i 合并时间 2026-06-01 16:40 文件变更 1 提交数 1 评论 1 代码增减 +2 / -2

执行摘要

明确 Ascend NPU 专用参数值文档

PR body 指出需要 'clarify Ascend NPU exclusive supported values for speculative args',即明确这些参数在 Ascend 平台上的独有支持值,避免用户误用。

可直接合并。作为文档改进,无需额外测试。适合精读以了解 Ascend NPU 的特定参数限制。

讨论亮点

无 review 讨论,仅 gemini-code-assist[bot] 自动回复确认变更内容无问题。

实现拆解

  1. 修改 docs_new/docs/hardware-platforms/ascend-npus/ascend_npu_support_features.mdx 文件中的两个表格单元格。
  2. --speculative-moe-a2a-backend 的值 ascend_fuseep 添加注释 (the only supported value on Ascend NPU)
  3. --speculative-draft-model-quantization 的值 unquant 添加注释 (the only supported value for speculative decoding on Ascend NPU)
  4. 无测试或配置变更。
文件 模块 状态 重要度
docs_new/docs/hardware-platforms/ascend-npus/ascend_npu_support_features.mdx 文档 modified 2.72

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

风险极低。仅修改文档注释,不影响代码逻辑或运行时行为。

正面影响:提高 Ascend NPU 用户配置效率,减少参数错误可能性。影响范围限于使用 Ascend NPU 并参考文档配置 speculative 功能的用户。

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论