Prhub

#23817 docs: verify GB300 Pro DeepSeek V4 recipes

原始 PR 作者 zijiexia 合并时间 2026-04-27 15:21 文件变更 1 提交数 1 评论 0 代码增减 +6 / -0

执行摘要

标记 GB300 Pro DeepSeek V4 配方已验证

根据 PR 描述,目的是标记 GB300 Pro 的 balanced 和 max-throughput 配方为已验证,并设置其 mem-fraction-static 为 0.9,以便用户在部署时可以直接使用已验证的配置。

可直接合入。团队成员可重点关注 GB300 Pro 的实际测试结果,若后续发现 mem-fraction-static 值需调整,可进一步优化。

讨论亮点

无 reviewer 评论讨论;仅有一个 AI 自动评论和直接审批。

实现拆解

  1. docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx 的已验证配方集合 VERIFIED_RECIPES 中,添加了 "gb300|big|balanced""gb300|big|max-throughput" 两个条目。
  2. balancedmax-throughput 两种配方的参数生成逻辑中,增加对 hardware === "gb300" && isBig 的判断分支,设置 --mem-fraction-static 0.9。该值高于 gb200 的 0.78 和 b200 的 0.82,可能与 GB300 Pro 的内存容量或模型显存占用特征有关。
文件 模块 状态 重要度
docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx 部署脚本 modified 5.19

关键源码片段

docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx core-logic

唯一变更文件,既是文档也是部署配置的 JSX 代码,验证状态和参数调整均在此处。

// 已验证配方集合:添加了 GB300 Pro big balanced 和 max-throughput
const VERIFIED_RECIPES = new Set([
    // ... 已有条目 ...
    "gb300|big|balanced",
    "gb300|big|max-throughput",
    // ... 其他条目 ...
]);// balanced 配方中设置 mem-fraction-static
if (hardware === "h200" && isBig) {
    flags.push("  --mem-fraction-static 0.88");
} else if (isBig && hardware === "gb300") {
    flags.push("  --mem-fraction-static 0.9"); // GB300 Pro 使用 0.9
} else if (isBig && hardware === "gb200") {
    flags.push("  --mem-fraction-static 0.78");
}// max-throughput 配方中同理
if (hardware === "h200" && isBig) {
    flags.push("  --mem-fraction-static 0.88");
} else if (isBig && hardware === "gb300") {
    flags.push("  --mem-fraction-static 0.9"); // GB300 Pro 使用 0.9
}

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

风险极低:仅修改文档/配置文件中的 Set 条目和条件分支,不影响核心服务逻辑。但若 mem-fraction-static 0.9 未经充分测试,在部分场景下可能导致 OOM,但鉴于已验证声明,风险可控。

对用户影响:GB300 Pro 用户在部署 big 模型时,balanced 和 max-throughput 配方的部署命令将不再被注释,可直接复制执行。对系统和团队无直接影响。影响程度低。

文档变更 无测试覆盖

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论