# PR #22705 完整报告

- 仓库：`sgl-project/sglang`
- 标题：Modify the optional values and constraints of parameter.
- 合并时间：2026-04-13 22:50
- 原文链接：http://prhub.com.cn/sgl-project/sglang/pull/22705

---

# 执行摘要
本次 PR 更新了 Ascend NPU 支持特性文档，为 Mamba 调度策略参数新增 `extra_buffer` 选项，并澄清分层缓存功能暂不支持 Mamba 模型（特别是 Qwen3-Next 系列）。这是一个纯文档变更，旨在提供更准确的功能描述，帮助用户避免配置错误，延续了近期 NPU 文档维护的趋势。

# 功能与动机
根据 PR body，本次变更旨在“修改参数的可选值和约束”，具体包括：
- 让 `--mamba-scheduler-strategy` 参数支持 `extra_buffer` 选项，扩展 Mamba 模型的调度策略。
- 在 `--enable-hierarchical-cache` 参数说明中，明确标注当前分层缓存功能不支持 Mamba 模型，特别是 Qwen3-Next 系列。

虽然没有关联 Issue，但从上下文推断，这些更新是为了反映 Ascend NPU 平台的最新功能状态和已知限制，确保文档与实际实现保持一致，减少用户因文档不清晰导致的配置问题。

# 实现拆解
变更仅涉及一个文件：`docs/platforms/ascend/ascend_npu_support_features.md`。具体修改如下：

| 参数 | 原内容 | 新内容 | 变更说明 |
|------|--------|--------|----------|
| `--mamba-scheduler-strategy` | Only `auto`, `no_buffer` supported | `auto`,<br/>`no_buffer`,<br/>`extra_buffer` | 新增 `extra_buffer` 选项，扩展调度策略支持 |
| `--enable-hierarchical-cache` | bool flag (set to enable) | bool flag (set to enable).<br/> Currently, Mamba cache is not supported. | 添加说明，明确分层缓存暂不支持 Mamba 模型 |

这些修改通过简单的文本更新完成，不涉及代码逻辑变更。

# 评论区精华
review 讨论中仅有一次实质性交流：
> gemini-code-assist[bot] 指出：“There's a minor grammatical error in the added note. It should be 'mamba cache **is**not supported'. For better clarity, you could also consider specifying that this applies to Mamba-based models...”

作者 chx96642264 回复“done”表示已采纳建议，将说明优化为“Currently, Mamba cache is not supported.”。讨论焦点集中在文档表述的准确性和清晰度上，没有技术争议。

# 风险与影响
**风险分析**：
- 信息同步风险：文档更新可能滞后于实际代码实现，若 `extra_buffer` 选项或分层缓存限制未在代码中正确实现，可能导致用户配置错误。但本次为纯文档变更，风险可控。
- 表述模糊风险：虽然语法已修正，但“Mamba cache is not supported”的表述可能被误解为所有 Mamba 缓存都不支持，而实际可能特指分层缓存场景。

**影响分析**：
- 对用户：帮助 Ascend NPU 用户更准确地配置 Mamba 调度策略和分层缓存，避免功能误用，特别是对 Qwen3-Next 模型用户明确了限制。
- 对系统：无功能、性能或安全性影响。
- 对团队：延续了近期 NPU 文档维护趋势（如 PR#22700、#22697 等），保持了文档与平台特性同步。

# 关联脉络
本次 PR 是近期一系列 NPU 文档更新的一部分：
- PR#22700、#22697、#22698 同样修改了 `ascend_npu_support_features.md` 文件，专注于参数约束澄清、新特性描述和默认值修正。
- 这些 PR 共同反映了团队对 Ascend NPU 平台文档维护的持续投入，确保文档准确反映平台功能状态和限制。

从更广的视角看，近期历史 PR 中 NPU 相关变更多为文档更新（如 PR#22712、#22687），表明该平台正处于功能完善和文档同步阶段，而核心功能开发（如 JIT 内核、扩散模型支持）则集中在其他模块。