#23622 Again update DeepSeek V4 cookbook

原始 PR 作者 fzyzcjy 合并时间 2026-04-24 15:12 文件变更 2 提交数 11 评论 2 代码增减 +32 / -9

执行摘要

再次更新 DeepSeek V4 部署指南，新增配方案例和 Docker 示例

继续完善DeepSeek V4部署文档，确保文档中的命令行参数真实可用。基于实际端到端测试，将更多硬件与配方的组合标记为已验证，并根据人类反馈纠正cp配方的标志逻辑，消除歧义和重复设置。

建议部署DeepSeek V4的用户阅读此PR以获取最新的命令行参考。开发者和文档维护者可关注cp配方中参数单一来源的处理方式，以及如何通过VERIFIED_RECIPES集合优雅地管理验证状态。此PR体现了sglang项目对文档易用性和准确性的持续投入。

讨论亮点

本PR没有来自人类审核者的评论。仅有的两个评论来自gemini-code-assist[bot]，内容为每日配额已达上限的通知，不涉及技术讨论。

实现拆解

简化配方选择器UI（deepseek-v4-deployment.jsx）：移除recipe选项集合中每个条目的subtitle字段，使界面只显示配方名称，更加清爽。
扩展已验证配方集合：在VERIFIED_RECIPES Set中添加了B200 Flash/Pro的balanced、max-throughput、cp组合，以及H200 Flash的low-latency、balanced、max-throughput组合。这些组合经过端到端验证，生成的命令不再被注释掉，用户可直接复制使用。
修复cp配方标志生成：调整buildCommand函数中cp分支：根据人类最新指示，不再设置--mem-fraction-static 0.70（移除覆盖），并将--max-running-requests改为条件设置——Blackwell Pro为256，其他情况（含H200）为1024。确保每个参数只出现一次，避免混淆。
补充Docker使用文档（DeepSeek-V4.mdx）：在Docker镜像表格下方添加指向安装指南的链接，并提供一个包含GPU挂载、共享内存、端口映射和模型缓存挂载的最小docker run示例，方便用户快速启动容器。

文件	模块	状态	重要度
`docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx`	命令生成器	modified	5.68
`docs_new/cookbook/autoregressive/DeepSeek/DeepSeek-V4.mdx`	用户指南	modified	2.68

关键符号

DeepSeekV4Deployment buildCommand buildPDDisaggCommand getInitialState

关键源码片段

docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx core-logic

核心变更文件：更新了已验证配方集合、简化了 UI、调整了 cp 配方的参数生成逻辑。直接影响用户复制的命令。

// cp 配方标志生成部分（简化抽取）
if (recipe === 'cp') {
  // ... 之前已加入 --tp、--moe-a2a-backend deepep 等通用标志
  flags.push('--mem-fraction-static 0.78');
  // 人类指示（2026-04-24）：不再设置 --mem-fraction-static 0.70 覆盖
  // 只设置 --max-running-requests 一次：Blackwell big 用 256，其余用 1024
  if (isBig && hardware !== 'h200') {
    flags.push('--cuda-graph-max-bs 256');
    flags.push('--max-running-requests 256');
  } else {
    flags.push('--max-running-requests 1024');
  }
  // H200 cp 在非多节点时加上 DeepEP 大 SMS 标志
  if (!multinode) flags.push(DEEPEP_LARGE_SMS_FLAG);
}

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论，后续有更多讨论时会体现在这里。

风险与影响

本PR本质上是文档和命令模板的更新，不涉及运行时逻辑，风险较低。主要风险在于：

命令参数正确性：cp配方中--max-running-requests的取值调整需要与sglang serve的实际支持能力一致。已根据人类指示和所有涉及的硬件配置核对，确保取值合理。
版本同步：随着未来模型权重更新或SGLang版本变化，已验证的配方可能需要重新验证，但此PR本身不会引入兼容性问题。

用户侧：获得更全面、已验证的部署命令，减少试错成本；新增的Docker示例使首次使用容器部署的用户更容易上手。
系统侧：不影响任何运行时逻辑或API行为。
团队侧：文档维护者可通过修改VERIFIED_RECIPES集合轻松管理已验证状态，但需注意保持与实际测试同步。

文档变更已验证状态更新

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接，后续同步到相关引用后会出现在这里。

完整报告

执行摘要

本PR是DeepSeek V4部署文档的增量更新，扩展了已验证的部署命令组合（新增B200和H200的多种配方），简化了配方选择器UI，修复了cp配方的参数生成逻辑，并补充了Docker运行示例。整体为低风险文档维护变更，对用户部署有实际指导价值。

功能与动机

继#23605和#23617初步建立DeepSeek V4部署指南后，团队通过端到端测试验证了更多硬件与配方组合（B200 Flash/Pro的 balanced、max-throughput、cp；H200 Flash的 low-latency、balanced、max-throughput），并将其标记为已验证，使生成的命令可直接复制运行。同时根据人类反馈，纠正了cp配方中 --max-running-requests 和 --mem-fraction-static 的参数处理，确保每个参数只出现一次，避免歧义。此外，为简化用户上手流程，在Docker镜像表格下方添加了最小 docker run 示例及安装文档链接。

实现拆解

步骤1：简化配方选择器UI

文件：docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx
变更：移除了recipe选项集合中每个条目（low-latency, balanced, max-throughput, cp, pd-disagg）的subtitle字段
原因：使界面更简洁，只显示配方名称，避免信息过载

步骤2：扩展已验证配方集合

文件：同上
变更：在VERIFIED_RECIPES Set中添加了以下键：
- b200|small|balanced、b200|small|max-throughput、b200|small|cp
- b200|big|balanced、b200|big|max-throughput、b200|big|cp
- h200|small|low-latency、h200|small|balanced、h200|small|max-throughput
原因：这些组合经过实际部署验证，确保命令参数正确可用

步骤3：修复cp配方标志生成逻辑

文件：同上
变更：调整buildCommand函数中recipe值为cp的分支：
- 移除 --mem-fraction-static 0.70（不再覆盖前面的0.78）
- 将 --max-running-requests 改为条件设置：Blackwell big（即isBig && hardware不是h200时）设为256，其他情况（包括H200）设为1024
原因：根据人类最新指示，避免参数重复设置，使命令清晰一致

下面是该逻辑的核心片段（已包含详尽的注释）：

步骤4：补充Docker使用文档

文件：docs_new/cookbook/autoregressive/DeepSeek/DeepSeek-V4.mdx
变更：在Docker镜像表格下方新增一段文字，包含指向安装文档的链接和最小 docker run 示例
原因：帮助用户快速启动容器部署，降低入门门槛

`docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx`

核心变更文件：更新了已验证配方集合、简化了UI、调整了cp配方的参数生成逻辑。直接影响用户复制的命令。

关键源码片段

`docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx`

核心变更文件：更新了已验证配方集合、简化了UI、调整了cp配方的参数生成逻辑。直接影响用户复制的命令。

// cp 配方标志生成部分（简化抽取）
if (recipe === 'cp') {
  // ... 之前已加入 --tp、--moe-a2a-backend deepep 等通用标志
  flags.push('--mem-fraction-static 0.78');
  // 人类指示（2026-04-24）：不再设置 --mem-fraction-static 0.70 覆盖
  // 只设置 --max-running-requests 一次：Blackwell big 用 256，其余用 1024
  if (isBig && hardware !== 'h200') {
    flags.push('--cuda-graph-max-bs 256');
    flags.push('--max-running-requests 256');
  } else {
    flags.push('--max-running-requests 1024');
  }
  // H200 cp 在非多节点时加上 DeepEP 大 SMS 标志
  if (!multinode) flags.push(DEEPEP_LARGE_SMS_FLAG);
}

评论区精华

本PR没有来自人类审核者的评论。仅有的两个评论来自 gemini-code-assist[bot]，内容为每日配额已达上限的通知，不涉及技术讨论。

风险与影响

风险：低风险。主要是文档和命令模板的更新，不影响运行时逻辑。cp配方参数调整需与实际sglang版本保持同步，已人工核对。
影响：
- 用户：获得更多已验证的一键部署命令，减少调试时间；Docker示例降低新手门槛。
- 系统：无运行时影响。
- 团队：文档维护更规范，已验证集合的管理更加清晰。

关联脉络

本PR是DeepSeek V4文档系列的一部分，前序PR包括：

PR#	标题	关联原因
#23605	Add DeepSeek V4 cookbook	首次建立DeepSeek V4交互部署文档
#23617	Further update Deepseek V4 docs	更新模型仓库地址等
#23634	Update pro fp8 checkpoint in DeepSeek V4 cookbook	同期文档更新，修改H200 Pro的模型地址

这些PR共同构建了DeepSeek V4在sglang上的部署指南体系，本PR在此基础上扩展了已验证配方的覆盖范围。

#23622 Again update DeepSeek V4 cookbook

执行摘要

再次更新 DeepSeek V4 部署指南，新增配方案例和 Docker 示例

实现拆解

评论区精华

没有提炼出高价值讨论线程

风险与影响

关联 Issue

未识别关联 Issue

完整报告

参与讨论