# PR #20846 完整报告

- 仓库：`sgl-project/sglang`
- 标题：Update ascend docs
- 合并时间：2026-03-25 14:58
- 原文链接：http://prhub.com.cn/sgl-project/sglang/pull/20846

---

# 执行摘要
此 PR 更新了 SGLang 项目中 Ascend NPU 平台的文档，主要删除已弃用参数 `--prefill-round-robin-balance`，并添加新功能参数如 `--prefill-delayer`，同时修正模型名称。变更范围限于文档文件，风险较低，旨在提升用户配置准确性和体验。

# 功能与动机
动机基于 PR body 中的表述："update the ascend docs by changes in models and features"。随着 SGLang 项目在 Ascend NPU 平台上功能和模型的不断演进（如新参数引入和模型更新），文档需要同步更新以避免用户使用过时信息，确保配置指南的准确性。

# 实现拆解
修改涉及 5 个文档文件，按模块拆解如下：
- **`ascend_npu_support_features.md`**：核心改动文件，添加了多个新服务器参数，例如：
 - `--enable-prefill-delayer` 及相关选项（如 `--prefill-delayer-max-delay-passes`）
 - `--attention-context-parallel-size` 和 `--moe-data-parallel-size` 等并行参数
 - 其他参数如 `--download-dir`、`--model-checksum`、`--hf-chat-template-name`
 更新了功能表格，帮助用户了解最新配置选项。

- **`ascend_npu_best_practice.md`**和 **`ascend_npu_deepseek_example.md`**：删除了已弃用参数 `--prefill-round-robin-balance`，调整示例命令以避免误导。
- **`ascend_npu_glm5_examples.md`**：修正 Docker 镜像来源描述，从 "Ascend platform" 改为 "online platform"，提高通用性。
- **`ascend_npu_support_models.md`**：更新模型名称，例如将 `openai/gpt-oss-120b` 改为 `eigen-ai-labs/gpt-oss-120b-bf16`，确保模型列表准确性。

# 评论区精华
在 review 中，gemini-code-assist[bot] 指出了 `ascend_npu_support_features.md` 中的格式化问题：
> "There are some formatting issues in the new table rows for `--attention-context-parallel-size` and `--moe-data-parallel-size` that affect readability and consistency..."
讨论聚焦于风格一致性（如默认值需用反引号包裹、表格对齐），无重大技术争议。建议在后续提交中可能被采纳并修复，显示了自动化工具在文档维护中的作用。

# 风险与影响
**风险分析**：
1. **文档信息不准确**：删除已弃用参数可能让仍依赖它的用户困惑；新参数描述若错误，可能导致配置失败。
2. **格式化问题**：虽然低风险，但影响可读性，可能降低用户体验。
3. **无代码风险**：纯文档变更，不引入回归、性能或安全问题。

**影响分析**：
- **用户影响**：Ascend NPU 用户需参考更新后的文档进行配置，避免使用过时参数；正确文档有助于提升部署效率和系统性能。
- **系统影响**：无直接代码变更，但错误文档可能间接导致用户配置错误，影响系统稳定性。
- **团队影响**：常规文档维护任务，无需额外资源，但强调文档与代码同步的重要性。

# 关联脉络
从历史 PR 分析，本项目中文档更新是常见活动：
- PR #21040 同样涉及文档更新（AMD MoRI 功能），显示文档维护伴随功能演进。
- PR #21330 更新 CI 测试文档，表明文档同步也涵盖基础设施变更。
本 PR 专注于 Ascend NPU 平台，反映了 SGLang 在多平台支持（如 NPU、AMD）中保持文档准确性的持续努力，有助于用户跨平台迁移和配置。