执行摘要
DSV4 部署生成器五项兼容性修复
修复 DeepSeek-V4 部署命令生成器中多项兼容性和正确性问题,确保不同硬件、量化及部署模式(如 Blackwell Balanced + MegaMoE、H200 Pro FP4 低延迟、PD-Disagg)下生成的命令可用且显存配置合理。
本 PR 为文档工具修复,值得部署团队关注,确保生成命令正确。无需深读源码。
无 review 评论。
修复 DeepSeek-V4 部署命令生成器中多项兼容性和正确性问题,确保不同硬件、量化及部署模式(如 Blackwell Balanced + MegaMoE、H200 Pro FP4 低延迟、PD-Disagg)下生成的命令可用且显存配置合理。
本 PR 为文档工具修复,值得部署团队关注,确保生成命令正确。无需深读源码。
无 review 评论。
SGLANG_OPT_DEEPGEMM_MEGA_MOE_NUM_MAX_TOKENS_PER_RANK=4096 以限制每 rank 的 dispatch 缓冲区,因为 Balanced 总是运行 MTP,需要更多显存余量。--mem-fraction-static 从 0.88 降至 0.83,为 draft 模型和 MTP 缓冲区提供更多余量;其他 H200 FP4 Pro 配方保持 0.88。:latest 镜像在 PR #25821 合并之前,因此保留旧 nsa-* 标志名,并在命令前添加 shell 注释提示将 nsa- 替换为 dsa-。HICACHE_UNSUPPORTED_RECIPES Set,包含 "pd-disagg";新增 isHicacheUnsupported 函数;在 resolveItems 中为 hicache 选项添加禁用逻辑。同时将 pd-disagg 加入 MEGAMOE_UNSUPPORTED_RECIPES。当切换到 pd-disagg 配方时,自动将 hicache 和 megamoe 设为 disabled。--reasoning-parser 和 --tool-call-parser 仅添加到 decode role 命令中,因为 PD HTTP 路由器返回 decode server 的响应,prefill role 不需要。| 文件 | 模块 | 状态 | 重要度 |
|---|---|---|---|
docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx |
部署命令生成器 | modified | 7.44 |
docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx
core-logic
唯一修改文件,包含所有五项修复的核心逻辑变更。
// 新增:HiCache 在 PD-Disagg 配方下不支持(生成器尚未发射相关标志)
const HICACHE_UNSUPPORTED_RECIPES = new Set(["pd-disagg"]);
const isHicacheUnsupported = (vals) =>
HICACHE_UNSUPPORTED_RECIPES.has(vals.recipe);
// 在 resolveItems 中处理 hicache 选项禁用
if (option.name === "hicache" && vals && isHicacheUnsupported(vals)) {
return option.items.map((it) =>
it.id === "disabled"
? it
: { ...it, disabled: true, disabledReason: "HiCache is not yet wired into the PD-Disagg cookbook command" }
);
}
// 配方切换时自动将 hicache 重置为 disabled
if (
optionName === "recipe" &&
next.hicache !== "disabled" &&
isHicacheUnsupported(next)
) {
next.hicache = "disabled";
}
当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。
影响仅限 DeepSeek-V4 部署命令生成器生成的 bash 命令,不会影响现有部署或运行时行为。对使用 cookbook 的用户有直接改善:Balanced+MegaMoE 不再 OOM,H200 Pro FP4 低延迟不再显存不足,PD-Disagg 命令不再缺失 parser 标志。
当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。
参与讨论