Prhub

#26164 [docs] DeepSeek-V4 cookbook: balanced MegaMoE cap, H200 Pro FP4 mem-frac, nsa-* compat, PD-disagg fixes

原始 PR 作者 zijiexia 合并时间 2026-05-23 17:42 文件变更 1 提交数 1 评论 0 代码增减 +66 / -7

执行摘要

DSV4 部署生成器五项兼容性修复

修复 DeepSeek-V4 部署命令生成器中多项兼容性和正确性问题,确保不同硬件、量化及部署模式(如 Blackwell Balanced + MegaMoE、H200 Pro FP4 低延迟、PD-Disagg)下生成的命令可用且显存配置合理。

本 PR 为文档工具修复,值得部署团队关注,确保生成命令正确。无需深读源码。

讨论亮点

无 review 评论。

实现拆解

  1. Balanced + MegaMoE 内存上限:在 Balanced 配方启用 MegaMoE 时,添加环境变量 SGLANG_OPT_DEEPGEMM_MEGA_MOE_NUM_MAX_TOKENS_PER_RANK=4096 以限制每 rank 的 dispatch 缓冲区,因为 Balanced 总是运行 MTP,需要更多显存余量。
  2. H200 Pro FP4 低延迟配方 mem-fraction-static 调整:将该配方的 --mem-fraction-static 从 0.88 降至 0.83,为 draft 模型和 MTP 缓冲区提供更多余量;其他 H200 FP4 Pro 配方保持 0.88。
  3. 上下文并行标志名兼容性:由于 :latest 镜像在 PR #25821 合并之前,因此保留旧 nsa-* 标志名,并在命令前添加 shell 注释提示将 nsa- 替换为 dsa-
  4. PD-Disagg 时禁用 HiCache 和 MegaMoE:新增 HICACHE_UNSUPPORTED_RECIPES Set,包含 "pd-disagg";新增 isHicacheUnsupported 函数;在 resolveItems 中为 hicache 选项添加禁用逻辑。同时将 pd-disagg 加入 MEGAMOE_UNSUPPORTED_RECIPES。当切换到 pd-disagg 配方时,自动将 hicache 和 megamoe 设为 disabled。
  5. PD-Disagg 下 parser 标志放置到 decode role--reasoning-parser--tool-call-parser 仅添加到 decode role 命令中,因为 PD HTTP 路由器返回 decode server 的响应,prefill role 不需要。
文件 模块 状态 重要度
docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx 部署命令生成器 modified 7.44

关键符号

isHicacheUnsupported isMegamoeUnsupported resolveItems

关键源码片段

docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx core-logic

唯一修改文件,包含所有五项修复的核心逻辑变更。

// 新增:HiCache 在 PD-Disagg 配方下不支持(生成器尚未发射相关标志)
const HICACHE_UNSUPPORTED_RECIPES = new Set(["pd-disagg"]);
const isHicacheUnsupported = (vals) =>
  HICACHE_UNSUPPORTED_RECIPES.has(vals.recipe);// 在 resolveItems 中处理 hicache 选项禁用
if (option.name === "hicache" && vals && isHicacheUnsupported(vals)) {
  return option.items.map((it) =>
    it.id === "disabled"
      ? it
      : { ...it, disabled: true, disabledReason: "HiCache is not yet wired into the PD-Disagg cookbook command" }
  );
}// 配方切换时自动将 hicache 重置为 disabled
if (
  optionName === "recipe" &&
  next.hicache !== "disabled" &&
  isHicacheUnsupported(next)
) {
  next.hicache = "disabled";
}

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

  1. Nsa-* 标志名回退可能导致用户使用 main 分支构建时仍使用旧名,但注释已提示替换。
  2. PD-Disagg 下禁用 HiCache 和 MegaMoE 是临时措施,未来需实现完整支持。
  3. 仅修改文档相关生成器,无运行时代码变更,风险较低。

影响仅限 DeepSeek-V4 部署命令生成器生成的 bash 命令,不会影响现有部署或运行时行为。对使用 cookbook 的用户有直接改善:Balanced+MegaMoE 不再 OOM,H200 Pro FP4 低延迟不再显存不足,PD-Disagg 命令不再缺失 parser 标志。

仅文档工具变更 临时禁用功能需后续实现

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论