Prhub

#25412 [Doc] DSV4 cookbook: clean up env vars, add MegaMoE toggle, unify docker image

原始 PR 作者 yhyang201 合并时间 2026-05-17 02:28 文件变更 1 提交数 3 评论 3 代码增减 +38 / -83

执行摘要

DSV4 部署文档清理环境变量,新增 MegaMoE 切换

DeepSeek-V4 部署文档中的环境变量逐渐过时(已默认启用或不再需要),且新增的 MegaMoE 后端需要在前端提供切换选项。此外希望统一 Docker 镜像以减少维护成本。这些改进便于用户正确生成部署命令并体验新功能。

建议阅读此 PR 的文件变更,了解 DSV4 部署配置的演进。特别关注如何通过前端配置实现后端功能选项的添加和清理。

讨论亮点

Reviewer Fridge003 指出 Docker 镜像统一变更应由专用 PR #25410 处理,建议移除该部分。作者采纳并回退了相关改动,最终 PR 仅聚焦环境变量清理和 MegaMoE 选项。

实现拆解

  1. 在命令生成器配置对象 options 中新增 megamoe 选项,提供 Disabled、W4A8、W4A4 三种选择。
  2. 清理多个部署模式(low-latency、balanced、max-throughput 等)中重复设置的 B200/B300 准确性验证环境变量,这些变量已被完全移除或无需手动设置。
  3. 在 generateCommand 函数中解构参数时新增 megamoe,为后续根据选择生成对应参数做准备。
    4.(回退)Docker 镜像统一部分因 reviewer 建议移到专用 PR #25410 而回退。
文件 模块 状态 重要度
docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx 部署文档 modified 6.35

关键符号

DeepSeekV4Deployment (component) generateCommand

关键源码片段

docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx core-logic

唯一变更文件,包含 MegaMoE 选项和环境变量清理。

// 在 options 对象中新增 MegaMoE 切换配置 ( 位于 HiCache 之后 )
megamoe: {
  name: "megamoe",
  title: "MegaMoE",
  items: [
    { id: "disabled", label: "Disabled", default: true },
    { id: "w4a8", label: "W4A8", default: false },
    { id: "w4a4", label: "W4A4", default: false, subtitle: "FP4 acts" },
  ],
},// generateCommand 函数解构增加 megamoe
const generateCommand = () => {
  const { hardware: rawHardware, modelSize, recipe, reasoningParser, toolcall, hicache, megamoe } = values;
  // 此后会根据 megamoe 的值决定是否追加 --moe-runner-backend megamoe 等参数
  // 同时删除了之前大量冗余的 env vars,例如 SGLANG_JIT_DEEPGEMM_PRECOMPILE 等
  // B200/B300 Pro 分支现在不再需要任何额外 env vars
}

评论区精华

移除 Docker 镜像统一变更 设计

Fridge003 因 #25410 已含类似变更,建议移除本 PR 中的 Docker 镜像改动。作者同意。

结论:移除了 Docker 镜像变更,留给 #25410。 · 已解决

风险与影响

风险较低。主要风险是用户可能依赖于被移除的环境变量,但这些变量已默认启用或不存在,影响极低。MegaMoE 选项依赖于 #25406,若该 PR 未合并则选项不可用,但文档已标明依赖关系。

影响范围限于 DeepSeek-V4 部署文档用户。命令生成将更简洁,不再包含冗余变量。新增 MegaMoE 切换使用户可以启用 W4A8/W4A4 精度。对系统其他模块无影响。

文档变更 依赖外部 PR

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论