执行摘要
DeepSeek-V4 cookbook 启用 DeepGemm warmup
依赖 PR#23756 和龙的新镜像,移除 SGLANG_JIT_DEEPGEMM_PRECOMPILE=0 以启用 DeepGemm warmup,从而提升 DeepSeek-V4 模型的启动和运行效率。
建议快速合并,此 PR 是文档/配置跟进,无技术风险。可精读第二个修复提交,了解如何修复遗漏引用错误。
无 review 评论或讨论。
依赖 PR#23756 和龙的新镜像,移除 SGLANG_JIT_DEEPGEMM_PRECOMPILE=0 以启用 DeepGemm warmup,从而提升 DeepSeek-V4 模型的启动和运行效率。
建议快速合并,此 PR 是文档/配置跟进,无技术风险。可精读第二个修复提交,了解如何修复遗漏引用错误。
无 review 评论或讨论。
COMMON_ENV 常量:在 generateCommand() 函数(第 260 行附近)中删除 const COMMON_ENV = ["SGLANG_JIT_DEEPGEMM_PRECOMPILE=0"];,因为新镜像已默认支持 DeepGemm warmup,无需再禁用预编译。buildRole() 中的重复声明:在 buildRole() 函数(第 520 行附近)中删除另一处相同的 const COMMON_ENV 声明,该声明是用于 PD 分离部署场景的。generateCommand() 中将 const envAll = [...HW_ENV, ...recipeEnv, ...COMMON_ENV] 改为 const envAll = [...HW_ENV, ...recipeEnv];在 buildRole() 中将 const envAll = [...HW_ENV, ...roleEnv, ...MNNVL_ENV, ...COMMON_ENV] 改为 const envAll = [...HW_ENV, ...roleEnv, ...MNNVL_ENV]。...COMMON_ENV 展开导致的引用错误。| 文件 | 模块 | 状态 | 重要度 |
|---|---|---|---|
docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx |
部署脚本 | modified | 4.28 |
分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。
当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。
该变更为纯文档/配置改动,风险极低。主要风险在于移除了 SGLANG_JIT_DEEPGEMM_PRECOMPILE=0 后,若环境未正确依赖新镜像(PR#23756),可能导致 DeepGemm warmup 失败或性能下降。但该风险已在 PR 描述中声明依赖关系。
当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。
参与讨论