Prhub

#23883 Enable DeepGemm warmup in DeepSeek-V4 cookbook

原始 PR 作者 Fridge003 合并时间 2026-04-28 09:41 文件变更 1 提交数 2 评论 2 代码增减 +3 / -5

执行摘要

DeepSeek-V4 cookbook 启用 DeepGemm warmup

依赖 PR#23756 和龙的新镜像,移除 SGLANG_JIT_DEEPGEMM_PRECOMPILE=0 以启用 DeepGemm warmup,从而提升 DeepSeek-V4 模型的启动和运行效率。

建议快速合并,此 PR 是文档/配置跟进,无技术风险。可精读第二个修复提交,了解如何修复遗漏引用错误。

讨论亮点

无 review 评论或讨论。

实现拆解

  1. 移除 COMMON_ENV 常量:在 generateCommand() 函数(第 260 行附近)中删除 const COMMON_ENV = ["SGLANG_JIT_DEEPGEMM_PRECOMPILE=0"];,因为新镜像已默认支持 DeepGemm warmup,无需再禁用预编译。
  2. 移除 buildRole() 中的重复声明:在 buildRole() 函数(第 520 行附近)中删除另一处相同的 const COMMON_ENV 声明,该声明是用于 PD 分离部署场景的。
  3. 更新环境变量组装逻辑:在 generateCommand() 中将 const envAll = [...HW_ENV, ...recipeEnv, ...COMMON_ENV] 改为 const envAll = [...HW_ENV, ...recipeEnv];在 buildRole() 中将 const envAll = [...HW_ENV, ...roleEnv, ...MNNVL_ENV, ...COMMON_ENV] 改为 const envAll = [...HW_ENV, ...roleEnv, ...MNNVL_ENV]
  4. 修复后续提交中的 ReferenceError:第二个提交修复了第一个提交中遗漏删除 ...COMMON_ENV 展开导致的引用错误。
文件 模块 状态 重要度
docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx 部署脚本 modified 4.28

关键符号

generateCommand buildRole

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

该变更为纯文档/配置改动,风险极低。主要风险在于移除了 SGLANG_JIT_DEEPGEMM_PRECOMPILE=0 后,若环境未正确依赖新镜像(PR#23756),可能导致 DeepGemm warmup 失败或性能下降。但该风险已在 PR 描述中声明依赖关系。

  • 用户:使用 DeepSeek-V4 部署 cookbook 的用户将默认启用 DeepGemm warmup,预期获得更好的启动和运行性能。
  • 系统:无直接影响,因为仅为文档代码片段。
  • 团队:需要确保相关镜像和 PR#23756 已合并发布,否则用户可能遇到问题。
依赖未合并 PR

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论