执行摘要

更新 DeepSeek V4 H200 文档中的模型仓库地址

让H200用户能够直接复制使用正确的FP8模型仓库地址，而不是遇到占位符报错。原始文档因等待Hopper checkpoint上传而使用了占位符，现在Flash模型的FP8重打包已公开，需要更新以提供可用的命令。

该PR属于日常文档维护，逻辑简单，无需精读。但值得留意的是，它反映了DeepSeek V4模型部署生态的进展——sgl-project开始发布FP8重打包模型。若后续Pro FP8也更新，可快速合并。

讨论亮点

无讨论。本PR没有收到review评论或issue讨论。

实现拆解

编辑文档代码片段文件 docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx：修改了HW_SIZE_SPEC中H200 small条目的slug字段，从占位符字符串"<TO_BE_UPLOADED_DeepSeek-V4-Flash-hopper>"改为实际可用的Hugging Face仓库ID"sgl-project/DeepSeek-V4-Flash-FP8"。
更新注释：将原来的注释从说明正在等待上传，改为解释为什么需要FP8独立检查点（deepseek-ai仓库的FP4混合权重在Hopper上无法运行）以及sgl-project已经发布FP8重打包，并指明Flash版本已公开，Pro版本仍在等待上传。
未更改其他配置：H200 big条目仍保留占位符，等待Pro FP8重打包上传后更新。
无测试或配置配套改动：本次变更仅为文档源码更新，不涉及测试或部署配置。

文件	模块	状态	重要度
`docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx`	文档	modified	4.4

关键源码片段

docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx core-logic

唯一变更文件，包含 H200 硬件配置的模型仓库地址和注释更新。

// 变更后的 H200 配置片段
const HW_SIZE_SPEC = {
  "b200|small": { slug: "deepseek-ai/DeepSeek-V4-Flash", tp: 4, multinode: false },
  "b200|big": { slug: "deepseek-ai/DeepSeek-V4-Pro", tp: 8, multinode: false },
  "gb300|small": { slug: "deepseek-ai/DeepSeek-V4-Flash", tp: 4, multinode: false },
  "gb300|big": { slug: "deepseek-ai/DeepSeek-V4-Pro", tp: 4, multinode: false },
  // H200 needs an FP8-only Instruct ckpt (deepseek-ai's Flash/Pro repos ship
  // FP4-mixed weights that Hopper can't run). sgl-project publishes FP8
  // repackagings; Flash is public, Pro is still being uploaded.
  "h200|small": { slug: "sgl-project/DeepSeek-V4-Flash-FP8", tp: 4, multinode: false },
  "h200|big": { slug: "<TO_BE_UPLOADED_DeepSeek-V4-Pro-FP8>", tp: 16, multinode: true, nnodes: 2 },
};
// 注释解释了为什么 H200 需要单独的 FP8 检查点，以及现在 Flash FP8 已可用。

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论，后续有更多讨论时会体现在这里。

风险与影响

风险极低。变更仅为文档中的字符串和注释更新，不涉及任何运行时逻辑或配置。唯一潜在风险是用户可能误认为Pro模型的FP8也已可用（但占位符仍在，且注释明确说明了状态），但这属于文档清晰度问题，不构成技术风险。

影响范围小，仅影响查看DeepSeek V4部署文档的H200用户。正面影响是H200 Flash用户现在可以直接复制命令，无需手动替换占位符。对于其他硬件（B200、GB300）无影响。

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接，后续同步到相关引用后会出现在这里。

完整报告

执行摘要

本PR更新了DeepSeek V4部署文档中H200硬件配置的模型仓库地址，将之前占位符替换为已公开的FP8重打包仓库sgl-project/DeepSeek-V4-Flash-FP8，并修正了相关注释说明。变更非常小（+5/-6），仅涉及一个文件，无技术风险。

功能与动机

让H200用户能够直接复制使用正确的FP8模型仓库地址，而不是遇到占位符报错。原始文档因等待Hopper checkpoint上传而使用了占位符，现在Flash模型的FP8重打包已公开，需要更新以提供可用命令。

实现拆解

编辑文档代码片段文件 docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx：修改了HW_SIZE_SPEC中H200 small条目的slug字段，从占位符字符串"<TO_BE_UPLOADED_DeepSeek-V4-Flash-hopper>"改为实际可用的Hugging Face仓库ID"sgl-project/DeepSeek-V4-Flash-FP8"。
更新注释：将原来的注释从说明正在等待上传，改为解释为什么需要FP8独立检查点（deepseek-ai仓库的FP4混合权重在Hopper上无法运行）以及sgl-project已经发布FP8重打包，并指明Flash版本已公开，Pro版本仍在等待上传。
未更改其他配置：H200 big条目仍保留占位符，等待Pro FP8重打包上传后更新。
无测试或配置配套改动：本次变更仅为文档源码更新，不涉及测试或部署配置。

`docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx`

唯一变更文件，包含H200硬件配置的模型仓库地址和注释更新。

关键源码片段

`docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx`

唯一变更文件，包含H200硬件配置的模型仓库地址和注释更新。

// 变更后的 H200 配置片段
const HW_SIZE_SPEC = {
  "b200|small": { slug: "deepseek-ai/DeepSeek-V4-Flash", tp: 4, multinode: false },
  "b200|big": { slug: "deepseek-ai/DeepSeek-V4-Pro", tp: 8, multinode: false },
  "gb300|small": { slug: "deepseek-ai/DeepSeek-V4-Flash", tp: 4, multinode: false },
  "gb300|big": { slug: "deepseek-ai/DeepSeek-V4-Pro", tp: 4, multinode: false },
  // H200 needs an FP8-only Instruct ckpt (deepseek-ai's Flash/Pro repos ship
  // FP4-mixed weights that Hopper can't run). sgl-project publishes FP8
  // repackagings; Flash is public, Pro is still being uploaded.
  "h200|small": { slug: "sgl-project/DeepSeek-V4-Flash-FP8", tp: 4, multinode: false },
  "h200|big": { slug: "<TO_BE_UPLOADED_DeepSeek-V4-Pro-FP8>", tp: 16, multinode: true, nnodes: 2 },
};
// 注释解释了为什么 H200 需要单独的 FP8 检查点，以及现在 Flash FP8 已可用。

评论区精华

无讨论内容。

风险与影响

影响范围小，仅影响查看DeepSeek V4部署文档的H200用户。正面影响是H200 Flash用户现在可以直接复制命令，无需手动替换占位符。

关联脉络

无直接关联的PR。该文档属于DeepSeek V4系列模型的持续部署文档维护的一部分，反映了sgl-project开始发布FP8重打包模型的生态进展。后续当Pro版FP8重打包上传后，可快速跟进更新。

#23617 Further update Deepseek V4 docs

执行摘要

更新 DeepSeek V4 H200 文档中的模型仓库地址

实现拆解

评论区精华

没有提炼出高价值讨论线程

风险与影响

关联 Issue

未识别关联 Issue

完整报告

执行摘要

功能与动机

实现拆解

`docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx`

关键源码片段

`docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx`

评论区精华

风险与影响

关联脉络

参与讨论