Prhub

#25370 [NEW MODEL] Add H200 validation for Ring-2.6-1T cookbook

原始 PR 作者 JustinTong0323 合并时间 2026-05-16 02:47 文件变更 2 提交数 1 评论 2 代码增减 +58 / -2

执行摘要

为 Ring-2.6-1T 新增 H200 x8 部署文档与基准测试

为了让用户能够参考 Ring-2.6-1T 模型在 NVIDIA H200 x8 上的已验证部署配置和性能数据,降低在 H200 硬件上部署该模型的门槛。

PR 内容清晰简洁,改动合规;适合合并。对于关注 H200 部署的用户有参考价值,其余开发者可快速浏览。

讨论亮点

review 中 gemini-code-assist[bot] 指出硬件列表虽已添加 H200,但后续 benchmark 结果未同步更新,建议补充数据或添加 "TBD" 占位符以维持一致性。虽然最终提交包含了 H200 的基准测试结果,但 comment 发出时结果尚未包含。wisclmy0611 批准了 PR,未再追加讨论。

实现拆解

  1. 修改部署命令生成器:在 docs_new/src/snippets/autoregressive/ring-26-1t-deployment.jsxoptions.hardware.items 中新增 { id: 'h200', label: 'H200 x8', default: false },并在 modelConfigs 中增加 h200: { tp: 8, memFraction: '0.95' }
  2. 更新部署说明:在 cookbook 文档 docs_new/cookbook/autoregressive/InclusionAI/Ring-2.6-1T.mdx 的“模型部署”一节添加 H200 x8 的 --tp-size 8--mem-fraction-static 0.95 命令行参数建议。
  3. 补充性能基准测试结果:在“Speed Benchmark”和“Throughput-Sensitive Benchmark”小节中分别插入 H200 x8 的测试结果(包括 latency、TTFT、TPOT、ITL 等),并更新硬件列表文字和表格。
文件 模块 状态 重要度
docs_new/src/snippets/autoregressive/ring-26-1t-deployment.jsx 部署片段 modified 4.89
docs_new/cookbook/autoregressive/InclusionAI/Ring-2.6-1T.mdx 部署文档 modified 4.14

关键源码片段

docs_new/src/snippets/autoregressive/ring-26-1t-deployment.jsx core-logic

Ring-2.6-1T 交互式命令生成器的 React 组件源码;变更增加了 H200 x8 硬件选项及其对应的 TP 与 mem_fraction 配置。

/* 在硬件选项数组中新增 `h200` 项,并添加其模型配置 */
export const Ring261TDeployment = () => {
  const options = {
    hardware: {
      name: 'hardware',
      title: 'Hardware Platform',
      items: [
        { id: 'gb300', label: 'GB300 x4', default: true },
        { id: 'b200', label: 'B200 x8', default: false },
        { id: 'h200', label: 'H200 x8', default: false }, // 新增 H200 x8 选项
      ],
    },
    // ... 其余选项保持不变
  };
  // H200 使用 TP=8、mem_fraction=0.95(与 B200 相同 TP,但 mem_fraction 更高)
  const modelConfigs = {
    gb300: { tp: 4, memFraction: '0.95' },
    b200: { tp: 8, memFraction: '0.8' },
    h200: { tp: 8, memFraction: '0.95' },
  };
  // ... 其余 UI state/effect 逻辑
};

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

变更仅为文档和 UI 配置项添加,不涉及任何实际推理、模型加载或后端逻辑改动。风险极低,主要风险是文档中提供的参数(如 mem_fraction)可能因环境差异导致部署失败,但 cookbook 已明确给出验证通过的配置。

对用户:提供 Ring-2.6-1T 在 H200 x8 上的已验证部署指导和性能基准,方便用户参考。对系统:无影响。对团队:文档维护工作量小,未来若 H200 参数调整需同步更新。

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论