Prhub

#20846 Update ascend docs

原始 PR 作者 amote-i 合并时间 2026-03-25 14:58 文件变更 5 提交数 7 评论 5 代码增减 +24 / -18

执行摘要

更新 Ascend NPU 平台文档,删除已弃用参数并添加新功能参数。

根据 PR body 中的表述,动机是 "update the ascend docs by changes in models and features",即随着 SGLang 项目中 Ascend NPU 支持的功能和模型更新,需要更新文档以保持准确性和完整性,避免用户使用过时信息。

对于技术管理者和工程师,此 PR 值得快速浏览以了解文档更新内容,特别是新添加的参数和模型名称变更,但无需深入代码审查。建议关注 ascend_npu_support_features.md 中的新参数,确保在使用 Ascend NPU 功能时参考最新文档。

讨论亮点

review 中仅有一次讨论,由 gemini-code-assist[bot] 发起,指出 ascend_npu_support_features.md 中新添加参数的格式化问题,包括默认值未用反引号包裹、表格对齐不一致、HTML 标签不统一等。该讨论聚焦于风格一致性,建议已提供,并在后续提交中可能修复。无重大设计争议或未解决疑虑。

实现拆解

修改了 5 个文档文件:

1) ascend_npu_support_features.md:添加多个新服务器参数(如 --prefill-delayer 及相关选项、--attention-context-parallel-size--moe-data-parallel-size 等),并更新参数表;
2) ascend_npu_best_practice.md:删除已弃用参数 --prefill-round-robin-balance
3) ascend_npu_deepseek_example.md:同样删除该参数;
4) ascend_npu_glm5_examples.md:修正 Docker 镜像来源描述;
5) ascend_npu_support_models.md:更新模型名称(如 GPT-OSS 和 MiniMax-M2 的准确名称)。所有变更集中在文档层面,不涉及代码逻辑修改。

文件 模块 状态 重要度
docs/platforms/ascend_npu_support_features.md Ascend NPU documentation modified 3.0
docs/platforms/ascend_npu_best_practice.md Ascend NPU documentation modified 2.0
docs/platforms/ascend_npu_support_models.md Ascend NPU documentation modified 2.0

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

文档格式化问题 style

gemini-code-assist[bot] 指出 ascend_npu_support_features.md 中新添加参数的格式化不一致,包括默认值未用反引号包裹、表格对齐问题、HTML 标签不自闭合。

结论:建议已提供,可能在后续提交中修复;无其他争议,问题已解决。 · 已解决

风险与影响

主要风险是文档信息可能不准确或误导用户:

1) 删除已弃用参数 --prefill-round-robin-balance 可能导致仍依赖该参数的用户困惑或配置错误;
2) 新添加参数(如 --prefill-delayer 相关选项)描述不完整或错误,可能影响用户正确使用功能;
3) 格式化问题可能降低文档可读性,但风险较低。无代码回归、性能或安全风险。

影响范围有限,主要针对使用 Ascend NPU 平台的用户和开发者。确保文档准确有助于用户正确配置服务器参数,提升用户体验和部署效率。对系统无直接代码影响,但错误文档可能导致用户配置错误,间接影响系统性能或稳定性。对团队而言,这是常规文档维护,无需额外培训或适配。

文档信息不准确 格式化错误

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论