Prhub

#23634 Update pro fp8 checkpoint in DeepSeek V4 cookbook

原始 PR 作者 fzyzcjy 合并时间 2026-04-24 15:58 文件变更 1 提交数 1 评论 0 代码增减 +2 / -2

执行摘要

更新 DeepSeek V4 部署文档中 H200 Pro 模型仓库地址

DeepSeek-V4-Pro-FP8仓库已公开可用,需要更新文档消除占位符,使H200 Pro用户能够直接复制命令使用。

本PR是常规文档更新,改动极小,可直接合并。建议关注是否有其他文档中的类似占位符需要一并更新。

讨论亮点

审查者gemini-code-assist仅给出确认性评论,无实质性讨论。

实现拆解

  1. 修改 docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx 文件中的 HW_SIZE_SPEC 对象,将 h200|big 条目的 slug 值从占位符 "<TO_BE_UPLOADED_DeepSeek-V4-Pro-FP8>" 改为实际仓库 "sgl-project/DeepSeek-V4-Pro-FP8"
  2. 同步更新同一文件中的注释,将 "Flash is public, Pro is still being uploaded" 改为 "repackagings for both variants",反映Pro也已发布。
    这两处修改共同使得H200 Pro的部署命令可自动生成有效模型路径。
文件 模块 状态 重要度
docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx 文档片段 modified 4.04

关键源码片段

docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx core-logic

唯一变更文件,更新了 H200 Pro 的模型仓库 slug 和相关注释。

// 在 HW_SIZE_SPEC 中,h200|big 的 slug 从占位符更新为实际仓库
const HW_SIZE_SPEC = {
  ...
  // sgl-project 为两个变体发布了 FP8 权重重封包
  "h200|small": { slug: "sgl-project/DeepSeek-V4-Flash-FP8", tp: 4, multinode: false },
  "h200|big": { slug: "sgl-project/DeepSeek-V4-Pro-FP8", tp: 16, multinode: true, nnodes: 2 },
};

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

本PR风险极低:仅涉及文档中一个字符串替换和一个注释更新,不触及任何运行时逻辑。如果仓库地址拼写错误,用户只需手动修正即可,无系统级影响。

  • 用户/文档读者:H200 Pro用户现在可获得可用命令,无需手动替换占位符。
  • 系统/服务:无代码变更,无影响。
  • 团队/维护:消除了遗留占位符,降低用户困惑。
低风险

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论