执行摘要
本PR更新了DeepSeek V4部署文档中H200硬件配置的模型仓库地址,将之前占位符替换为已公开的FP8重打包仓库sgl-project/DeepSeek-V4-Flash-FP8,并修正了相关注释说明。变更非常小(+5/-6),仅涉及一个文件,无技术风险。
功能与动机
让H200用户能够直接复制使用正确的FP8模型仓库地址,而不是遇到占位符报错。原始文档因等待Hopper checkpoint上传而使用了占位符,现在Flash模型的FP8重打包已公开,需要更新以提供可用命令。
实现拆解
-
编辑文档代码片段文件 docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx:修改了HW_SIZE_SPEC中H200 small条目的slug字段,从占位符字符串"<TO_BE_UPLOADED_DeepSeek-V4-Flash-hopper>"改为实际可用的Hugging Face仓库ID"sgl-project/DeepSeek-V4-Flash-FP8"。
-
更新注释:将原来的注释从说明正在等待上传,改为解释为什么需要FP8独立检查点(deepseek-ai仓库的FP4混合权重在Hopper上无法运行)以及sgl-project已经发布FP8重打包,并指明Flash版本已公开,Pro版本仍在等待上传。
-
未更改其他配置:H200 big条目仍保留占位符,等待Pro FP8重打包上传后更新。
-
无测试或配置配套改动:本次变更仅为文档源码更新,不涉及测试或部署配置。
docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx
唯一变更文件,包含H200硬件配置的模型仓库地址和注释更新。
关键源码片段
docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx
唯一变更文件,包含H200硬件配置的模型仓库地址和注释更新。
// 变更后的 H200 配置片段
const HW_SIZE_SPEC = {
"b200|small": { slug: "deepseek-ai/DeepSeek-V4-Flash", tp: 4, multinode: false },
"b200|big": { slug: "deepseek-ai/DeepSeek-V4-Pro", tp: 8, multinode: false },
"gb300|small": { slug: "deepseek-ai/DeepSeek-V4-Flash", tp: 4, multinode: false },
"gb300|big": { slug: "deepseek-ai/DeepSeek-V4-Pro", tp: 4, multinode: false },
// H200 needs an FP8-only Instruct ckpt (deepseek-ai's Flash/Pro repos ship
// FP4-mixed weights that Hopper can't run). sgl-project publishes FP8
// repackagings; Flash is public, Pro is still being uploaded.
"h200|small": { slug: "sgl-project/DeepSeek-V4-Flash-FP8", tp: 4, multinode: false },
"h200|big": { slug: "<TO_BE_UPLOADED_DeepSeek-V4-Pro-FP8>", tp: 16, multinode: true, nnodes: 2 },
};
// 注释解释了为什么 H200 需要单独的 FP8 检查点,以及现在 Flash FP8 已可用。
评论区精华
无讨论内容。
风险与影响
风险极低。变更仅为文档中的字符串和注释更新,不涉及任何运行时逻辑或配置。唯一潜在风险是用户可能误认为Pro模型的FP8也已可用(但占位符仍在,且注释明确说明了状态),但这属于文档清晰度问题,不构成技术风险。
影响范围小,仅影响查看DeepSeek V4部署文档的H200用户。正面影响是H200 Flash用户现在可以直接复制命令,无需手动替换占位符。
关联脉络
无直接关联的PR。该文档属于DeepSeek V4系列模型的持续部署文档维护的一部分,反映了sgl-project开始发布FP8重打包模型的生态进展。后续当Pro版FP8重打包上传后,可快速跟进更新。
参与讨论