# PR #22860 完整报告

- 仓库：`sgl-project/sglang`
- 标题：[NPU] Offloading docs update
- 合并时间：2026-04-15 15:04
- 原文链接：http://prhub.com.cn/sgl-project/sglang/pull/22860

---

# 执行摘要

- 一句话：更新 NPU 卸载功能文档，澄清参数限制和 DeepSeek 专属支持。
- 推荐动作：该 PR 属于简单的文档更新，无需深入技术分析。对于 NPU 平台开发者或配置人员，建议关注文档中明确的限制条件（必须禁用 CUDA 图、DeepSeek 专属支持），这些信息对正确配置环境至关重要。对于一般开发者，无需精读此 PR。

# 功能与动机

从 PR 标题“[NPU] Offloading docs update”和文档变更内容可以看出，本次修改的目的是澄清 NPU 平台上卸载功能的使用限制。具体来说，需要明确：1）Offloading 功能必须与 `--disable-cuda-graph` 参数一起使用；2）多个卸载参数（如 `--offload-group-size`、`--offload-num-in-group` 等）仅支持 DeepSeek 模型。这些澄清有助于用户正确配置 NPU 环境，避免因参数误用导致的功能异常。

# 实现拆解

1. **文档标题更新**：在 `docs/platforms/ascend/ascend_npu_support_features.md` 文件中，将 Offloading 部分的标题从“## Offloading”修改为“## Offloading (must be used with `--disable-cuda-graph`)”，明确该功能的使用前提条件。
2. **参数说明细化**：移除了 `--cpu-offload-gb` 参数描述中“must be used with `--disable-cuda-graph`”的重复说明（该限制已在标题中统一说明），同时为 `--offload-group-size`、`--offload-num-in-group`、`--offload-prefetch-step` 三个参数添加了“(DeepSeek only)”标注。
3. **选项范围限定**：将 `--offload-mode` 参数的选项说明从通用的 `cpu`、`meta`、`sharded_gpu` 修改为明确标注每个选项都“仅支持 DeepSeek 模型”，即 `cpu` (DeepSeek only)、`meta` (DeepSeek only)、`sharded_gpu` (DeepSeek only)。
4. **无测试或配置配套改动**：本次变更仅涉及文档文件，没有对应的代码、测试或配置文件的修改。

关键文件：
- `docs/platforms/ascend/ascend_npu_support_features.md`（模块 平台文档；类别 docs；类型 documentation）: 这是本次 PR 唯一修改的文件，包含了 NPU 平台支持特性的完整文档，特别是卸载功能的配置说明。

关键符号：未识别


# 评论区精华

本次 PR 没有实质性的 review 讨论。唯一的 review 记录是 sglang-npu-bot 的自动批准，且评论内容为空。这表明文档更新内容相对简单直接，没有引发技术争议或设计权衡的讨论。

- 暂无高价值评论线程

# 风险与影响

- 风险：**技术风险极低**：
 1. **回归风险**：无，仅修改文档说明，不涉及任何代码逻辑变更。
 2. **性能风险**：无，文档更新不影响系统运行时性能。
 3. **兼容性风险**：无，文档澄清有助于提升配置兼容性，避免用户错误配置。
 4. **安全风险**：无，不涉及安全相关变更。
唯一潜在风险是文档说明可能仍不完整或存在歧义，但基于当前变更内容，这种风险较低。

- 影响：**影响范围有限**：
 1. **对用户的影响**：正面影响。为使用 Ascend NPU 平台的用户提供了更准确的卸载功能配置指导，特别是明确了 DeepSeek 模型的专属支持，有助于减少配置错误和调试时间。
 2. **对系统的影响**：无直接影响。文档变更不改变系统行为或性能。
 3. **对团队的影响**：维护团队需要确保文档与实际功能保持一致，本次更新有助于提升文档准确性。
影响程度为低，仅涉及特定平台（NPU）和特定功能（Offloading）的文档澄清。

- 风险标记：暂无

# 关联脉络

- 暂无明显关联 PR