# PR #23041 完整报告

- 仓库：`sgl-project/sglang`
- 标题：[Docs] [npu] change the feature support status
- 合并时间：2026-04-17 14:34
- 原文链接：http://prhub.com.cn/sgl-project/sglang/pull/23041

---

# PR 23041 分析报告：更新 Ascend NPU 平台文档支持状态

## 执行摘要
本次 PR 更新了 `docs/platforms/ascend/ascend_npu_support_features.md` 文档，将解聚解码配置标志 `--disaggregation-decode-enable-offload-kvcache` 的支持状态从“计划中”修正为“A2, A3”，以反映该功能已在特定 Ascend NPU 型号上实际实现。这是一个纯文档更新，不影响任何代码逻辑，风险极低，旨在提升文档准确性。

## 功能与动机
根据 PR body 描述，本次变更的动机是 **更新文档以反映实际实现状态**。具体来说，`--disaggregation-decode-enable-offload-kvcache` 是一个服务器配置参数，用于在解聚解码模式下控制是否启用 KV 缓存卸载功能。文档此前将其标记为“Planned”（计划中），但实际已在 Ascend NPU A2 和 A3 型号上实现，因此需要修正为“A2, A3”以提供准确信息，避免用户误解。

## 实现拆解
本次变更仅涉及一个文档文件，实现过程非常简单：

1. **变更入口**：修改 `docs/platforms/ascend/ascend_npu_support_features.md` 文件，该文件是 Ascend NPU 平台的功能支持参考文档，包含服务器参数表格。
2. **核心更新**：在文档的服务器参数参考表格中，定位到 `--disaggregation-decode-enable-offload-kvcache` 行，将其“Support”列的值从“Planned”更改为“A2, A3”。以下为更新后的行内容（包含注释解释）：

```markdown
| `--disaggregation-decode-`<br/>`enable-offload-kvcache` | `False` | `False` | A2, A3 |
<!-- 此行位于服务器参数参考表格中，用于描述解聚解码模式下启用KV缓存卸载的配置标志。
     - 第一列：参数名（带换行格式化）。
     - 第二列：默认值（False）。
     - 第三列：GPU平台默认值（False）。
     - 第四列：支持状态，已从“Planned”更新为“A2, A3”，表明该功能已在Ascend NPU A2和A3型号上实现并可用。
-->
```

3. **无配套改动**：此 PR 为纯文档更新，未修改任何源代码、测试、配置或部署文件，因此无需考虑联动变更。

## 评论区精华
本次 PR 的 review 过程极为简单，仅由 `sglang-npu-bot` 自动批准，没有人工 review 评论或讨论。这表明变更被认定为低风险、非争议性的文档修正，无需深入技术讨论。

## 风险与影响
**技术风险**：极低。纯文档更新不涉及代码逻辑，因此无回归、性能、安全或兼容性风险。唯一潜在风险是文档准确性依赖——需确保“A2, A3”的支持状态与实际代码实现一致，但此风险应由原始功能实现保证，不在本 PR 范围内。

**影响分析**：
- **用户影响**：使用 Ascend NPU 平台的开发者 / 运维人员将获得更准确的功能支持信息，有助于正确配置 `--disaggregation-decode-enable-offload-kvcache` 参数，避免因文档过时导致的配置错误。
- **系统影响**：无，文档变更不改变系统行为、性能或功能。
- **团队影响**：维护了文档的时效性和准确性，支持了团队对文档质量的持续改进。

## 关联脉络
从近期历史 PR 分析中，可以看出与本 PR 相关的脉络：
- **解聚功能完善**：PR 22990 修复了解聚模式下的缓存初始化问题，与本 PR 文档中更新的 `--disaggregation-decode-enable-offload-kvcache` 参数同属解聚解码特性，表明团队近期在持续完善解聚相关功能。
- **KV 缓存优化**：PR 22406 优化了推测解码下的 KV 缓存页需求估算，与本 PR 涉及的 KV 缓存卸载功能在内存管理主题上相关，均属于解码阶段性能优化的范畴。

整体上，本次文档更新是 Ascend NPU 平台功能支持状态同步的一部分，反映了实际开发进展，有助于保持文档与代码实现的一致性。