执行摘要

添加 DeepSeek-V4 部署交互指南与命令面板

DeepSeek-V4模型发布后，需要为用户提供官方部署文档，降低上手门槛。PR通过交互式矩阵让用户按硬件、模型规模和部署场景一键生成正确的sglang serve命令。

建议精读deepseek-v4-deployment.jsx的生成器实现，其配置驱动、严格对齐外部真实脚本的设计模式值得在后续文档中复用。同时建议在VERIFIED_RECIPES中记录验证状态，未来可逐渐扩大覆盖率。

讨论亮点

未发现实质性review讨论。PR仅包含自动生成的mintlify预览和quota容量提醒。

实现拆解

新增交互式命令生成组件 (docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx): 定义DeepSeekV4Deployment React组件，通过options对象配置硬件（B200/GB300/H200）、模型大小（Flash 285B / Pro 1.6T）、Recipe（低延迟/均衡/最大吞吐/CP/PD-Disagg）以及推理解析器和工具调用开关。generateCommand函数根据用户选择拼接CLI命令，并处理多节点、已验证/未验证配方等细节。
新增使用指南文档 (docs_new/cookbook/autoregressive/DeepSeek/DeepSeek-V4.mdx): 详细说明模型仓库、关键特性、部署配置建议（包括并发和DeepEP缓冲区大小）以及基准测试链接。所有启动命令统一指向上述交互组件，避免正文内重复。
注册到导航配置 (docs_new/docs.json): 在DeepSeek分组下插入cookbook/autoregressive/DeepSeek/DeepSeek-V4条目，使新页面出现在文档侧边栏。
更新首页入口 (docs_new/cookbook/autoregressive/intro.mdx): 将DeepSeek卡片链接从旧的V3_2改为V4，引导用户直接访问新文档。

文件	模块	状态	重要度
`docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx`	命令面板	added	8.98
`docs_new/cookbook/autoregressive/DeepSeek/DeepSeek-V4.mdx`	使用指南	added	5.62
`docs_new/docs.json`	导航配置	modified	2.36
`docs_new/cookbook/autoregressive/intro.mdx`	主页入口	modified	2.31

关键符号

DeepSeekV4Deployment resolveItems getInitialState checkDarkMode handleRadioChange commentOutCommand multiNodeFlags prependMultiNodeNote

关键源码片段

docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx core-logic

核心交互组件，定义部署矩阵和命令生成逻辑，是本次变更的技术主体。

// 定义部署矩阵的五个选项组：硬件、模型大小、部署策略、推理解析器、工具调用
const options = {
  hardware: {
    name: "hardware",
    title: "Hardware Platform",
    items: [
      { id: "b200", label: "B200 (FP4)", default: true },
      { id: "gb300", label: "GB300 (FP4)", default: false },
      { id: "h200", label: "H200 (FP8)", default: false },
    ],
  },
  modelSize: {
    name: "modelSize",
    title: "Model Variant",
    items: [
      { id: "small", label: "Flash", default: true, subtitle: "285B" },
      { id: "big", label: "Pro", default: false, subtitle: "1.6T" },
    ],
  },
  // ... recipe, reasoningParser, toolcall 类似定义
};

// 根据当前选择的选项拼接启动命令
export const DeepSeekV4Deployment = () => {
  const [values, setValues] = useState(getInitialState);
  // ...
  const generateCommand = (hardware, modelSize, recipe, parser, toolcall) => {
    // 基于硬件和模型大小确定张量并行度、节点数等参数
    // 并拼接 --model-path 等标志
    // 对于未验证的配方，整块代码被注释掉，用户复制时不会生效
  };
  // 渲染单选按钮和结果命令区域
};

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论，后续有更多讨论时会体现在这里。

风险与影响

命令准确性风险：生成器代码注释显示部分命令（如H200）因检查点未公开而包含<TO_BE_UPLOADED>占位符，用户直接复制可能失败。已通过只注释未验证配方来缓解，但仍有误导可能。
维护负担：生成器逻辑与sunrise_allinone.py耦合，未来DeepSeek-V4更新时需要同步修改，否则产生差异。
跨浏览器样式风险：暗色模式检测依赖于MutationObserver，极端浏览环境下可能失效，但影响仅限于UI显示。

用户：显著降低DeepSeek-V4部署的复杂度，尤其对于不熟悉多节点/FP4等配置的用户。系统：新增一个JSX文件（569行）、一个MDX文档（453行），导航树增加一个节点，无性能影响。团队：减少了针对V4部署问题的重复答疑成本，但要求维护者跟进模型更新。影响程度：中等。

H200 checkpoint 未公开发布生成命令未经全部验证与外部脚本耦合

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接，后续同步到相关引用后会出现在这里。

完整报告

执行摘要

新增DeepSeek-V4部署交互指南，包含一个交互式命令生成组件（JSX）和一个详细的使用指南（MDX），帮助用户根据硬件平台、模型变体和部署策略一键生成正确的sglang serve命令。同时更新了文档导航和首页入口。变更以文档为主，风险较低。

功能与动机

DeepSeek-V4模型发布后，用户需要一个清晰、可操作的部署指南。该PR通过交互式矩阵，将复杂的部署参数组合（3种硬件×2种模型大小×5种Recipe×2个解析器开关）转化为直观的选择界面，并自动生成命令，降低用户误配置风险。

实现拆解

交互式命令生成组件
文件：docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx （+569行）

定义DeepSeekV4Deployment React组件，内含options配置对象，声明硬件平台（B200/GB300/H200）、模型变体（Flash/Pro）、部署策略（low-latency/balanced/max-throughput/cp/pd-disagg）、推理解析器和工具调用开关。
核心函数generateCommand根据用户当前选中的值，拼接CLI命令。对于尚未在真实检查点上验证的配方（即不在VERIFIED_RECIPES集合中的），整个命令块被注释掉，用户复制粘贴后不会意外执行未经验证的配置。
暗色模式通过MutationObserver监听<html>的class/data-theme/style变化自动适配。

使用指南文档
文件：docs_new/cookbook/autoregressive/DeepSeek/DeepSeek-V4.mdx （+453行）

以表格形式列出Flash（284B）和Pro（1.6T）的参数量、激活参数量及适用场景。
说明关键特性：混合注意力（SWA+MLA）、DeepEP通信、FP4 MoE专家等。
“配置建议”小节指导用户使用上一步的交互组件生成命令，并提示并发度和DeepEP缓冲区大小的调整。
性能基准测试指向独立的生成器页面，避免正文内分散启动命令。

导航注册
文件：docs_new/docs.json （+1行）

在DeepSeek分组中插入cookbook/autoregressive/DeepSeek/DeepSeek-V4，使新页面出现在侧边栏。

首页入口更新
文件：docs_new/cookbook/autoregressive/intro.mdx （+1/-1行）

将DeepSeek卡片链接从旧的V3_2改为V4，确保用户从自动回归模型首页直接跳转到最新文档。

`docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx`

核心交互组件，定义部署矩阵和命令生成逻辑，是本次变更的技术主体。

关键源码片段

`docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx`

核心交互组件，定义部署矩阵和命令生成逻辑，是本次变更的技术主体。

// 定义部署矩阵的五个选项组：硬件、模型大小、部署策略、推理解析器、工具调用
const options = {
  hardware: {
    name: "hardware",
    title: "Hardware Platform",
    items: [
      { id: "b200", label: "B200 (FP4)", default: true },
      { id: "gb300", label: "GB300 (FP4)", default: false },
      { id: "h200", label: "H200 (FP8)", default: false },
    ],
  },
  modelSize: {
    name: "modelSize",
    title: "Model Variant",
    items: [
      { id: "small", label: "Flash", default: true, subtitle: "285B" },
      { id: "big", label: "Pro", default: false, subtitle: "1.6T" },
    ],
  },
  // ... recipe, reasoningParser, toolcall 类似定义
};

// 根据当前选择的选项拼接启动命令
export const DeepSeekV4Deployment = () => {
  const [values, setValues] = useState(getInitialState);
  // ...
  const generateCommand = (hardware, modelSize, recipe, parser, toolcall) => {
    // 基于硬件和模型大小确定张量并行度、节点数等参数
    // 并拼接 --model-path 等标志
    // 对于未验证的配方，整块代码被注释掉，用户复制时不会生效
  };
  // 渲染单选按钮和结果命令区域
};

评论区精华

无实质review讨论。仅有的机器人评论提供了Mintlify预览和API配额警告，无技术交锋。

风险与影响

风险：H200 FP8检查点尚未公开，生成器会输出<TO_BE_UPLOADED>占位符；已验证的配方仅为B200 small/big的low-latency，其他配方均被注释，用户若手动取消注释可能使用未测试的命令。生成器与sunrise_allinone.py强耦合，未来模型配置更新需同步修改。
影响：正面为主，为用户提供标准化的部署起点，降低DeepSeek-V4的上手成本。对现有功能无影响，纯文档添加。

关联脉络

23617 （后续PR）已跟进修复本PR中H200文档的模型仓库地址。
与#23493、#23545等MoE bugfix无关，但与DeepSeek模型家族的文档演进（如#22774 MUSA后端支持）共同完善了SGLang对DeepSeek的全面支持。

#23605 Add DeepSeek V4 cookbook

执行摘要

添加 DeepSeek-V4 部署交互指南与命令面板

实现拆解

评论区精华

没有提炼出高价值讨论线程

风险与影响

关联 Issue

未识别关联 Issue

完整报告

执行摘要

功能与动机

实现拆解

`docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx`

关键源码片段

`docs_new/src/snippets/autoregressive/deepseek-v4-deployment.jsx`

评论区精华

风险与影响

关联脉络

23617 （后续PR）已跟进修复本PR中H200文档的模型仓库地址。

参与讨论