Prhub

#24676 [NPU] [DOC] refresh npu supported model list

原始 PR 作者 amote-i 合并时间 2026-05-08 17:08 文件变更 1 提交数 2 评论 3 代码增减 +94 / -16

执行摘要

刷新 NPU 支持的模型列表

根据 PR 描述:'refresh npu supported model list',即定期更新 NPU 支持的模型列表,以反映最新的兼容状态。

此 PR 属于常规文档维护,适合快速合并。但建议后续在文档中注明模型版本与代码配置的对应关系,或增加自动校验机制。

讨论亮点

Review 中 gemini-code-assist[bot] 提出了两个问题:一是新增的 Qwen3.6 模型家族列使用了 'Qwen3.6',与表中其他 Qwen 条目的 'Qwen' 不一致;二是 Kimi-K2.6 在代码中仅有 K2.5 配置,可能版本不匹配。作者对第二个问题回复 'Non-issue',PR 合并时未修改。

实现拆解

  1. 识别需要新增的模型:包括 Eco-Tech 的多款 Qwen3.5、Qwen3.6 量化模型,以及 GLM-5、Kimi-K2.6、MiniMax 等。
  2. 在文档表格中插入新行:为每个新模型添加独立的 块,填写 Model ID、Family、Offline 和 Online 支持状态。
  3. 移除不再支持的模型:删除了 Qwen/Qwen3.5-397B-A17B 等老旧条目。
  4. 处理 review 反馈:针对机器人评论中对 Qwen 家族命名一致性的质疑,文档最终保持使用 'Qwen3.6' 等具体版本名,未统一为 'Qwen';对于 Kimi-K2.6 与代码版本不匹配的问题,作者认定为非问题。
文件 模块 状态 重要度
docs_new/docs/hardware-platforms/ascend-npus/ascend_npu_support_models.mdx NPU 文档 modified 4.01

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

Qwen 模型家族名称一致性 设计

gemini-code-assist[bot] 指出新增的 Qwen3.6 条目中 Model Family 列填写的是 'Qwen3.6',但表中其他 Qwen 模型均使用 'Qwen',建议统一为 'Qwen'。

结论:PR 合并时未更改,作者未回应,保持原样。 · unresolved

Kimi-K2.6 版本与代码不匹配 正确性

gemini-code-assist[bot] 指出文档新增了 Kimi-K2.6,但代码中只有 K2.5 配置,可能不匹配。

结论:作者 amote-i 回复 'Non-issue',认为没有问题。PR 合并。 · 已解决

风险与影响

主要风险是文档与代码实际支持的版本不一致。例如 Kimi-K2.6 在代码中仅有 K2.5 配置,可能误导用户认为 K2.6 已被支持。此外,Qwen3.6 系列在代码库中尚无对应配置文件,可能引起困惑。建议在添加文档时同步检查代码支持情况。

对用户:提供更新、更准确的支持列表,便于选择可用模型。对系统:无影响。对团队:增加文档维护负担,需确保文档与代码版本同步。

文档与代码版本不一致 模型版本号可能错误

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论