Prhub

#23617 Further update Deepseek V4 docs

原始 PR 作者 fzyzcjy 合并时间 2026-04-24 13:23 文件变更 1 提交数 1 评论 2 代码增减 +5 / -6

执行摘要

更新 DeepSeek V4 H200 文档中的模型仓库地址

让H200用户能够直接复制使用正确的FP8模型仓库地址,而不是遇到占位符报错。原始文档因等待Hopper checkpoint上传而使用了占位符,现在Flash模型的FP8重打包已公开,需要更新以提供可用的命令。

该PR属于日常文档维护,逻辑简单,无需精读。但值得留意的是,它反映了DeepSeek V4模型部署生态的进展——sgl-project开始发布FP8重打包模型。若后续Pro FP8也更新,可快速合并。

讨论亮点

无讨论。本PR没有收到review评论或issue讨论。

实现拆解

  1. 编辑文档代码片段文件 docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx:修改了HW_SIZE_SPEC中H200 small条目的slug字段,从占位符字符串"<TO_BE_UPLOADED_DeepSeek-V4-Flash-hopper>"改为实际可用的Hugging Face仓库ID"sgl-project/DeepSeek-V4-Flash-FP8"
  2. 更新注释:将原来的注释从说明正在等待上传,改为解释为什么需要FP8独立检查点(deepseek-ai仓库的FP4混合权重在Hopper上无法运行)以及sgl-project已经发布FP8重打包,并指明Flash版本已公开,Pro版本仍在等待上传。
  3. 未更改其他配置:H200 big条目仍保留占位符,等待Pro FP8重打包上传后更新。
  4. 无测试或配置配套改动:本次变更仅为文档源码更新,不涉及测试或部署配置。
文件 模块 状态 重要度
docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx 文档 modified 4.4

关键源码片段

docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx core-logic

唯一变更文件,包含 H200 硬件配置的模型仓库地址和注释更新。

// 变更后的 H200 配置片段
const HW_SIZE_SPEC = {
  "b200|small": { slug: "deepseek-ai/DeepSeek-V4-Flash", tp: 4, multinode: false },
  "b200|big": { slug: "deepseek-ai/DeepSeek-V4-Pro", tp: 8, multinode: false },
  "gb300|small": { slug: "deepseek-ai/DeepSeek-V4-Flash", tp: 4, multinode: false },
  "gb300|big": { slug: "deepseek-ai/DeepSeek-V4-Pro", tp: 4, multinode: false },
  // H200 needs an FP8-only Instruct ckpt (deepseek-ai's Flash/Pro repos ship
  // FP4-mixed weights that Hopper can't run). sgl-project publishes FP8
  // repackagings; Flash is public, Pro is still being uploaded.
  "h200|small": { slug: "sgl-project/DeepSeek-V4-Flash-FP8", tp: 4, multinode: false },
  "h200|big": { slug: "<TO_BE_UPLOADED_DeepSeek-V4-Pro-FP8>", tp: 16, multinode: true, nnodes: 2 },
};
// 注释解释了为什么 H200 需要单独的 FP8 检查点,以及现在 Flash FP8 已可用。

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

风险极低。变更仅为文档中的字符串和注释更新,不涉及任何运行时逻辑或配置。唯一潜在风险是用户可能误认为Pro模型的FP8也已可用(但占位符仍在,且注释明确说明了状态),但这属于文档清晰度问题,不构成技术风险。

影响范围小,仅影响查看DeepSeek V4部署文档的H200用户。正面影响是H200 Flash用户现在可以直接复制命令,无需手动替换占位符。对于其他硬件(B200、GB300)无影响。

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论