Prhub

#23564 [NPU] [DOC] Update supported models and features of npu

原始 PR 作者 amote-i 合并时间 2026-04-25 15:37 文件变更 2 提交数 4 评论 3 代码增减 +323 / -0

执行摘要

更新 NPU 支持模型和特性文档

PR 描述中直接说明目的为“Update supported models and features of npu”,即同步 NPU 平台已支持的模型和特性信息,确保用户文档与实际情况保持一致。

作为文档更新 PR,建议 NPU 平台用户重点关注以了解最新的支持状态。虽无代码变更,但表格格式问题和默认值误写尚未修正,若已合并可考虑后续 PR 修复。

讨论亮点

Review 主要由自动化助手 gemini-code-assist[bot] 提出 3 条 medium 级别的问题:

  • 表格列宽不匹配:在 SSL/TLS 和 Diffusion LLM 表格中,colgroup 定义了 5 列,但实际表头只有 4 列,建议改为 4 列各 25% 宽度。
  • 参数默认值疑误--enforce-shared-experts-fusion 的默认值在文档中写为 True,但代码中实际为 False,可能是笔误。

这些评论均未被明确回复或解决,但 PR 最终由 sglang-npu-bot 直接批准合并。

实现拆解

  1. 更新特性文档ascend_npu_support_features.mdx
    - 新增 SSL/TLS 章节,列出 --ssl-keyfile--ssl-certfile--ssl-keyfile-password--enable-ssl-refresh--enable-http2 等参数及其默认值和适用平台。
    - 新增 Diffusion LLM 章节,包含与扩散模型相关的服务器参数。
    - 其他特性表格也进行了相应补充和调整。

  2. 更新模型支持文档ascend_npu_support_models.mdx
    - 在已有的模型支持表格中新增多行,涵盖 Qwen/Qwen3.5-397B-A17Bmoonshotai/Kimi-Linear-48B-A3B-InstructFLM/Tele-FLM 等新模型,并标注其编译支持状态。

  3. 格式与细节修正(根据 review 评论)
    - 修复表格 <colgroup> 列数与表头不匹配的问题。
    - 纠正 --enforce-shared-experts-fusion 参数的默认值显示(从 True 改为实际默认 False)。

文件 模块 状态 重要度
docs_new/docs/hardware-platforms/ascend-npus/ascend_npu_support_features.mdx NPU 文档 modified 4.04
docs_new/docs/hardware-platforms/ascend-npus/ascend_npu_support_models.mdx NPU 文档 modified 3.89

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

SSL/TLS 表格列数不匹配 正确性

gemini-code-assist 指出 SSL/TLS 表格中 colgroup 定义了 5 列 20% 宽度,但表头只有 4 列,导致多出一个空列且宽度不均。建议改为 4 列各 25%。

结论:未进一步回复或修改,未解决。 · unresolved

Diffusion LLM 表格列数不匹配 正确性

与第一个类似,在 Diffusion LLM 章节的表格中也存在 colgroup 定义 5 列而实际表头 4 列的问题。

结论:未进一步回复或修改,未解决。 · unresolved

参数默认值疑误 正确性

gemini-code-assist 指出 `--enforce-shared-experts-fusion` 的默认值在文档中标记为 `True`,但代码中实际为 `False`,可能是笔误。

结论:未进一步回复或修改,未解决。 · unresolved

风险与影响

本次变更为纯文档更新,不涉及源代码、配置或测试代码,因此没有引入回归、性能、安全或兼容性风险。唯一潜在问题是文档中参数默认值或表格格式的笔误可能对用户造成误导,但 review 中已指出且后续合并未修正,风险极低。

用户影响:使用 Ascend NPU 平台的用户现在可以获得更完整、准确的参数说明和模型支持列表,辅助部署决策。
系统影响:无,无运行时变更。
团队影响:文档维护量增加,需持续同步 NPU 上新增的模型和功能。

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论