#25971 [CPU Doc]Add Xeon CPU info in Qwen3 Cookbook

原始 PR 作者 ZailiWang 合并时间 2026-05-27 03:14 文件变更 2 提交数 12 评论 16 代码增减 +26 / -10

执行摘要

为 Qwen3 Cookbook 添加 Xeon CPU 支持

PR body 明确说明动机是 'Adding Xeon support information into SGLang Cookbook. Starting with Qwen3 page.' 旨在让用户了解如何在 Xeon CPU 上部署 Qwen3 模型。

作为文档更新，值得快速查阅以了解 Xeon 支持的范围。但建议关注 TP 值和 FP8 设置的后续验证，如有实际测试结果应补充更新。该 PR 展示了在文档中为特定硬件平台添加参数配置的典型做法。

讨论亮点

Review 核心围绕 TP 值的正确性和 FP8 支持展开。gemini-code-assist[bot] 指出多个模型的 TP 值（如 6、3）不能整除 attention head 数，会导致运行时错误，并建议改为 1、2、4 等 2 的幂，同时将 FP8 设为 false。作者 ZailiWang 回应 'TP 3/6 is required for 6th Gen Xeon Processors'，坚持了原有值，但未就 FP8 问题作出说明。此外，review 还指出了冗余的 UI 逻辑和绝对链接问题，作者均进行了修改。最终 reviewer zijiexia 批准合并。

实现拆解

修改 JSX 组件 (qwen3-deployment.jsx): 在硬件配置对象中为每个模型大小添加 xeon 键，指定 TP (tensor parallel) 值和 FP8 开关。TP 值根据 6 代 Xeon 处理器特性设为 6 或 3，FP8 设为 true（但 review 指出 CPU 不支持 FP8）。同时移除了一段冗余的 UI 逻辑（硬编码 hardware default）。
更新 MDX 文档 (Qwen3.mdx): 添加了指向 CPU 安装指南的链接，更新硬件平台描述以包含 Intel Xeon CPU，并在部署参数说明中增加了 CPU 配置提示。
配套调整: 将两个文档中的外部绝对链接替换为内部相对链接，确保在不同环境下正常工作。

文件	模块	状态	重要度
`docs_new/src/snippets/autoregressive/qwen3-deployment.jsx`	部署配置	modified	6.28
`docs_new/cookbook/autoregressive/Qwen/Qwen3.mdx`	使用指南	modified	2.78

关键源码片段

docs_new/src/snippets/autoregressive/qwen3-deployment.jsx core-logic

核心变更文件，在硬件配置字典中为每个模型添加了 xeon 键和 TP/FP8 参数，同时清理了冗余 UI 逻辑。

// 文件 : docs_new/src/snippets/autoregressive/qwen3-deployment.jsx
// 在 modelConfigs 的每个模型项中添加 xeon 配置
const modelConfigs = {
  '235b': {
    baseName: '235B-A22B',
    hasThinkingVariants: true,
    h100: { tp: 8, ep: 0, bf16: true, fp8: true },
    // ... 其他 GPU 配置
    mi355x: { tp: 4, ep: 0, bf16: true, fp8: true },
    xeon: { tp: 6, ep: 0, bf16: true, fp8: true } // 新增，TP=6 针对 6 代 Xeon
  },
  '30b': {
    // ...
    xeon: { tp: 3, ep: 0, bf16: true, fp8: true } // 新增，TP=3
  },
  // 其他模型类似（32b TP=6, 14b/8b/4b/1.7b/0.6b TP=3）
};

// 被移除的冗余逻辑（已删除）:
// if (values.hardware === 'xeon') {
// options.hardware.items.map(...)
// }

评论区精华

TP 值正确性 正确性

gemini-code-assist[bot] 指出多个模型的 TP 值（如 6、3）不能整除 attention head 数，会导致运行时错误，建议改为 1、2、4 等 2 的幂。作者回应 'TP 3/6 is required for 6th Gen Xeon Processors'，坚持了原值。

结论：作者未接受建议，维持了 TP 3/6，认为对于 6 代 Xeon 是必要的。但未提供 attention head 可整除的证据。 · unresolved

FP8 支持 正确性

gemini-code-assist[bot] 指出 SGLang CPU 后端不支持 FP8 量化，建议将 xeon 配置中的 fp8 设为 false。作者未就此做出回应。

结论：未解决，文档中仍显示 fp8: true，可能误导用户。 · unresolved

冗余 UI 逻辑 设计

gemini-code-assist[bot] 指出一段硬编码 hardware default 的非受控逻辑是冗余的，因为已有的 isChecked 状态能正确处理。作者回复 'verified and removed the snippet' 并删除了该代码。

结论：已解决，作者移除了冗余代码。 · 已解决

文档链接相对化 documentation

gemini-code-assist[bot] 建议将新增的外部绝对链接改为相对链接，以保持一致性。作者回复 'updated accordingly'，已修改。

结论：已解决，链接已改为相对路径。 · 已解决

风险与影响

主要风险在于 TP 配置可能不兼容：若 Qwen3 模型的 attention head 数不能被 6 或 3 整除，实际部署时会报错。作者声称 TP 3/6 是 6 代 Xeon 处理器所必需，但未提供验证数据。此外，FP8 设置为 true 可能误导用户，因为 SGLang CPU 后端目前不支持 FP8。文档中的错误信息会影响用户体验。

影响范围限于文档阅读者，主要是计划在 Intel Xeon CPU 上部署 Qwen3 的用户。变更提供了明确的配置示例，有助于降低部署门槛，但若 TP 值错误则可能导致用户部署失败。无任何代码逻辑变更，逆向兼容性无影响。

TP 配置可能不兼容 FP8 设置误导缺少验证数据

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接，后续同步到相关引用后会出现在这里。

完整报告

执行摘要

本 PR 在 Qwen3 Cookbook 中添加了 Intel Xeon CPU 的部署支持信息，包括交互式命令生成器的硬件配置和文档中的安装指导。变更主要涉及两个文件，但 review 中出现了关于 TP 数值正确性和 FP8 支持的争议，作者部分采纳了建议，但在关键参数上坚持己见。合并时这些争议未完全解决，可能对用户造成误导。

功能与动机

PR body 明确说明动机是 'Adding Xeon support information into SGLang Cookbook. Starting with Qwen3 page.' 旨在帮助用户在 Intel Xeon CPU 上部署 Qwen3 模型，填补文档中 CPU 部分的空白。

实现拆解

部署配置组件 (JSX) 扩展: 在 qwen3-deployment.jsx 的 modelConfigs 对象中，为每个模型大小（235B 到 0.6B）新增 xeon 键，设置 TP 值（大模型 6，中小模型 3）和 FP8 true。同时删除了一段硬编码 hardware default 的冗余逻辑，该逻辑被 review 指出是无效的。
文档 Markdown 更新: 在 Qwen3.mdx 中添加指向 CPU 安装指南的相对链接，更新硬件描述以包含 Intel Xeon CPU，并在部署参数章节新增 CPU 配置提示，建议用户参考 CPU 服务器文档了解 TP 和 NUMA 绑定。
配套修复: 将 review 中提到的两个绝对链接改为相对链接，确保在预览和生产环境的一致行为。

`docs_new/src/snippets/autoregressive/qwen3-deployment.jsx`

核心变更文件，在硬件配置字典中为每个模型添加了 xeon 键和 TP/FP8 参数，同时清理了冗余 UI 逻辑。

// 文件 : docs_new/src/snippets/autoregressive/qwen3-deployment.jsx
// 在 modelConfigs 的每个模型项中添加 xeon 配置
const modelConfigs = {
  '235b': {
    baseName: '235B-A22B',
    hasThinkingVariants: true,
    h100: { tp: 8, ep: 0, bf16: true, fp8: true },
    // ... 其他 GPU 配置
    mi355x: { tp: 4, ep: 0, bf16: true, fp8: true },
    xeon: { tp: 6, ep: 0, bf16: true, fp8: true } // 新增，TP=6 针对 6 代 Xeon
  },
  '30b': {
    // ...
    xeon: { tp: 3, ep: 0, bf16: true, fp8: true } // 新增，TP=3
  },
  // 其他模型类似（32b TP=6, 14b/8b/4b/1.7b/0.6b TP=3）
};

// 被移除的冗余逻辑（已删除）:
// if (values.hardware === 'xeon') {
// options.hardware.items.map(...)
// }

评论区精华

TP 值正确性: gemini-code-assist[bot] 提出 'The tp size for Xeon should ideally be a power of 2' 且 '128 is not divisible by 6'，建议改为 tp:4。作者回应 'TP 3/6 is required for 6th Gen Xeon Processors'，未接受建议，亦未提供整除证据。
FP8 支持: review 指出 'SGLang's CPU backend currently does not support FP8 quantization'，建议设为 false，但作者未回应，最终 merged 版本仍保留 fp8: true。
冗余逻辑 和 链接相对化: 作者接受了这两项建议并修改。

风险与影响

TP 配置风险: 若 Qwen3 模型的 attention head 数不能被 6 或 3 整除，用户按文档配置将直接运行失败。虽然作者声称 TP 3/6 是 6 代 Xeon 必须，但未提供验证数据，风险较高。
FP8 误导风险: CPU 后端不支持 FP8，但配置显示 fp8: true，可能使用户尝试无效选项或产生困惑。
影响范围: 仅影响阅读文档的 Qwen3 CPU 部署用户，无代码逻辑变更。

关联脉络

该 PR 与 #12662（CPU Qwen3-VL/Omni 支持）属于同一功能线，前者实现 CPU 支持功能，后者补充部署文档，逐步完善 CPU 平台的用户指引。后续可能需要对 Qwen3 各模型 attention head 数进行验证并修正 TP 值。

#25971 [CPU Doc]Add Xeon CPU info in Qwen3 Cookbook

执行摘要

为 Qwen3 Cookbook 添加 Xeon CPU 支持

实现拆解

评论区精华

风险与影响

关联 Issue

未识别关联 Issue

完整报告

参与讨论