# PR #26413 完整报告

- 仓库：`sgl-project/sglang`
- 标题：[docs] DeepSeek-V4 cookbook: note cu129 image for GB200 Pro DeepEP backend
- 合并时间：2026-05-27 03:08
- 原文链接：http://prhub.com.cn/sgl-project/sglang/pull/26413

---

# PR 分析报告 : [docs] DeepSeek-V4 cookbook: note cu129 image for GB200 Pro DeepEP backend

## 执行摘要

该 PR 为 DeepSeek-V4 部署文档中的 GB200 Pro 配置添加了一条镜像选择注释。当用户选择 GB200 + Pro + MegaMoE 禁用（即使用 DeepEP 后端）时，生成的 `sglang serve` 命令上方会显示注释，提示应使用 CUDA 12.9 的 docker 镜像（`lmsysorg/sglang:latest-cu129`）而非默认的 CUDA 13 镜像，从而避免因 DeepEP 后端不兼容导致的启动失败。

## 功能与动机

DeepSeek-V4 在 GB200 Pro 上禁用 MegaMoE 时会使用 DeepEP 作为 all-to-all 通信后端。但项目默认的 `lmsysorg/sglang:latest` 镜像基于 CUDA 13，而 DeepEP 后端仅存在于 CUDA 12.9 镜像中。用户直接使用默认镜像会因缺少 `mnnvl` 等组件而报错。PR 在文档中直接引导用户切换镜像，减少配置困惑。

## 实现拆解

1. **修改文件**：`docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx`，该文件是 DeepSeek-V4 部署命令的动态生成器。
2. **新增条件判断**：在已有 GB200 多节点环境变量提示之后、H200 低延迟分支之前，插入一段条件逻辑：`hardware === "gb200" && isBig && megamoe === "disabled" && flags.some(f => f.includes("--moe-a2a-backend deepep"))`。
3. **条件排除效果**：
 - 低延迟配置使用 `flashinfer_mxfp4`，不包含 `--moe-a2a-backend deepep`，注释不会出现。
 - W4A8 / W4A4 配置中 DeepEP 被 megamoe 覆盖，同样不会出现。
4. **注释风格**：采用与上文 GB200 多节点提示一致的 shell 注释格式，维持文档一致性。

### `docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx`

该文件是 DeepSeek-V4 部署命令的生成器，本次 PR 在此添加了 cu129 镜像的注释提示，影响部署文档的可用性。

```jsx
    // GB200 Pro with MegaMoE disabled runs the DeepEP a2a backend, which is
    // currently only packaged in the CUDA 12.9 image — the default `:latest`
    // ships CUDA 13 and does not include a compatible DeepEP build.
    if (
      hardware === "gb200" &&
      isBig &&
      megamoe === "disabled" &&
      flags.some((f) => f.includes("--moe-a2a-backend deepep"))
    ) {
      cmd =
        `# NOTE: for the DeepEP backend, use the cu129 docker image\n` +
        `# (lmsysorg/sglang:latest-cu129) instead of the default \`:latest\`.\n` +
        cmd;
    }

```

## 评论区精华

无 review 讨论。评审者 wisclmy0611 直接批准。

## 风险与影响

- **风险**：极低。仅添加文档注释，不影响任何运行时逻辑。注意未来若 DeepEP 后端镜像要求变化，注释需同步更新。
- **影响**：仅影响访问 DeepSeek-V4 部署文档并选择特定配置的用户，将获得更清晰的镜像指引，减少配置错误。

## 关联脉络

该 PR 是 DeepSeek-V4 文档的持续完善，与近期 HPU CI 文档 PR #25971 类似，均属于文档类改进。无其他直接关联的 Issue 或 PR。