Prhub

#26413 [docs] DeepSeek-V4 cookbook: note cu129 image for GB200 Pro DeepEP backend

原始 PR 作者 zijiexia 合并时间 2026-05-27 03:08 文件变更 1 提交数 1 评论 1 代码增减 +14 / -0

执行摘要

DeepSeek-V4 部署文档补充 cu129 镜像提示

默认 lmsysorg/sglang:latest 镜像使用 CUDA 13,不包含兼容的 DeepEP 后端(mnnvl),用户直接使用会失败。需要在部署命令旁以 shell 注释形式给用户清晰指引。

值得合入,PR 精确解决了用户在使用 GB200 Pro 部署 DeepSeek-V4 时的常见镜像选择困惑。实现简洁、条件精准,代码可读性好。

讨论亮点

无 review 讨论。Wisclmy0611 评审者直接批准。

实现拆解

  1. 在 deepseek-v4-deployment.jsx 的命令组装函数中,在 GB200 多节点提示之后、H200 低延迟分支之前,插入一个条件判断。
  2. 判断条件为:hardware === "gb200" && isBig && megamoe === "disabled" && flags.some(f => f.includes("--moe-a2a-backend deepep")),确保仅当选择 GB200 Pro 且禁用 MegaMoE(使用 DeepEP)时生效。
  3. 在满足条件时,在 cmd 前拼接两行 shell 注释,提示用户使用 cu129 镜像。注释风格与已有的多节点环境变量提示一致。
  4. 该条件自动跳过低延迟配置(flashinfer_mxfp4)和 W4A8/W4A4 配置(DeepEP 被 megamoe 覆盖),无需额外检查。
文件 模块 状态 重要度
docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx 文档 modified 6.02

关键源码片段

docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx core-logic

该文件是 DeepSeek-V4 部署命令的生成器,本次 PR 在此添加了 cu129 镜像的注释提示,影响部署文档的可用性。

    // GB200 Pro with MegaMoE disabled runs the DeepEP a2a backend, which is
    // currently only packaged in the CUDA 12.9 image — the default `:latest`
    // ships CUDA 13 and does not include a compatible DeepEP build.
    if (
      hardware === "gb200" &&
      isBig &&
      megamoe === "disabled" &&
      flags.some((f) => f.includes("--moe-a2a-backend deepep"))
    ) {
      cmd =
        `# NOTE: for the DeepEP backend, use the cu129 docker image\n` +
        `# (lmsysorg/sglang:latest-cu129) instead of the default \`:latest\`.\n` +
        cmd;
    }

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

风险极低。仅增加条件化的文档注释输出,未修改任何运行时逻辑。条件分支本身正确,但需注意未来若 DeepEP 后端镜像变更或 CUDA 版本更新,注释可能过时。

影响范围有限,仅对 DeepSeek-V4 部署文档生成器的用户有效。用户将看到更清晰的镜像选择指引,减少配置错误。

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论