Prhub

#25778 [NPU] [DOC] remove Qwen3-235B-A22B 2K+2K 100ms mixed mode benchmark

原始 PR 作者 amote-i 合并时间 2026-05-19 20:48 文件变更 1 提交数 1 评论 0 代码增减 +0 / -82

执行摘要

移除 NPU 文档中的 100ms 基准配置

根据 PR body,目的是移除此基准配置,可能的原因为该配置已不再推荐或已被更优方案取代。作者仅写了 "remove Qwen3-235B-A22B 2K+2K 100ms mixed mode benchmark"。

此 PR 仅为文档清理,可快速合并。但建议跟进 reviewer 的意见,确保表格中的引用一致性。

讨论亮点

reviewer gemini-code-assist[bot] 指出,删除表格行后导致与仍保留的 50ms 基准不一致,建议更新为 50ms 基准引用。但 sglang-npu-bot 直接批准了 PR,未采纳此建议。

实现拆解

  1. 删除表格行:在 ascend_npu_best_practice.mdx 的基准汇总表中,移除了 Qwen3-235B-A22B / Atlas 800I A3 / 8 卡 / PD Mixed / 2K+2K / 100ms / W8A8 INT8 的对应行。
  2. 删除详细配置节:移除了该基准的完整部署命令、环境变量设置和测试命令等内容。
  3. 共删除 82 行,无新增行。
文件 模块 状态 重要度
docs_new/docs/hardware-platforms/ascend-npus/ascend_npu_best_practice.mdx NPU 文档 modified 3.46

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

删除表格行导致不一致 documentation

gemini-code-assist[bot] 指出,删除 100ms 基准的表格行后,仍保留的 50ms 基准的表格行存在引用不一致,建议更新表格以反映 50ms 基准。

结论:未采纳,sglang-npu-bot 直接批准 PR。 · unresolved

风险与影响

低风险。仅涉及文档删除,不影响代码功能。但可能导致引用该基准的用户找不到配置,需确保文档中已存在替代配置。

影响范围小,仅影响阅读该文档的用户,移除的基准配置不再可用,但保留的 50ms 配置仍可参考。

文档不一致

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论