Prhub

#23945 docs: enable MiMo V2.5 MTP cookbook path

原始 PR 作者 JustinTong0323 合并时间 2026-04-29 01:22 文件变更 2 提交数 1 评论 2 代码增减 +90 / -88

执行摘要

为 MiMo-V2.5 base 启用 EAGLE MTP 文档与代码片段

PR body 明确提到:'Enable EAGLE MTP for MiMo-V2.5 in the cookbook command generator. Update the MiMo-V2.5 deployment notes to describe the checkpoint MTP path and the required Hopper flags.' 即让 base 变体用户也能从 cookbook 获得正确的 MTP 配置和命令。

值得快速阅读。本 PR 展示了如何在文档层面为新变体启用已存在的功能,以及如何修正参数名并同步基准数据。Code Snippet 中的条件移除和逻辑统一是典型的小重构,对入门者理解前端配置驱动的范式有参考价值。另外 review 中关于 benchmark 数据有效性检查的提醒值得团队注意。

讨论亮点

Review 共 2 条评论,均由 gemini-code-assist[bot] 提出:

  1. --dp = TP / 4 表达式可能被误解:审查者建议用文字说明或占位符避免歧义,例如 'Set --dp to TP / 4'。该评论未得到作者回复,但最终 PR 被合并,可能已隐式采纳或认为不关键。

  2. 多模态 benchmark 数据异常:第 5.3.3 节的图像评测结果中多项指标为 0(如生成 token 数、TTFT 等),审查者怀疑数据采集有误,要求更新。作者已在后续提交中替换了该部分数据(此处指最终合并版本已修正)。两个讨论均未引发长线程,仅单次评论后直接通过。

实现拆解

  1. 移除变量级禁用约束docs_new/src/snippets/autoregressive/mimo-v25-deployment.jsx):在 computeConstraints 中删除针对非 Pro 变体强制禁用 EAGLE MTP 的代码块(if (!isPro) { c.eagleMtp = { force: "disabled", reason: "..." }; }),使 base 变体不再受限。
  2. 统一启用条件:将 useMtp 变量的条件从 isPro && eagleMtp === "enabled" 改为 eagleMtp === "enabled",确保 base 变体选中 EAGLE 时也可生成 MTP 标志。
  3. 修正命令行标志:将 "--speculative-algo EAGLE" 更正为 "--speculative-algorithm EAGLE",保证与实际参数名一致。
  4. 更新可选开关说明:注释中移除 "Pro only" 措辞,EAGLE MTP 的 subtitle 从 "Pro only" 改为 "EAGLE",反映两变体均支持。
  5. 同步 cookbook 描述docs_new/cookbook/autoregressive/Xiaomi/MiMo-V2.5.mdx):更新 MTP 相关段落,明确说明 base 变体也可使用 MTP 权重进行 EAGLE 规范解码;补充 DeepEP 和 DP-attention 的配置说明。
  6. 替换基准测试数据:将速度基准结果更新为使用 EAGLE MTP 配置(H200 8×GPU)的实际运行数据,包括延迟和吞吐量。
文件 模块 状态 重要度
docs_new/src/snippets/autoregressive/mimo-v25-deployment.jsx 文档片段 modified 5.85
docs_new/cookbook/autoregressive/Xiaomi/MiMo-V2.5.mdx 文档正文 modified 4.5

关键源码片段

docs_new/src/snippets/autoregressive/mimo-v25-deployment.jsx core-logic

部署命令生成器核心脚本。移除了 base 变体禁用 EAGLE MTP 的强制约束,修正了参数名,是本次功能启用的关键文件。

// 从 computeConstraints 中删除了针对非 Pro 的强制禁用块,
// 使 base 变体也可自由选择 EAGLE MTP。const computeConstraints = (options, variant, hwKey) => {
  ...
  if (!isPro) {
    // 之前此处有:c.eagleMtp = { force: "disabled", reason: "..." };
    // 现已删除,因此 base 变体的 EAGLE 选项不再被固定。
    if (spec && spec.dp > 1) {
      c.dpAttention = { force: "enabled", reason: "DP attention required for dp>1" };
    } else {
      c.dpAttention = { force: "disabled", reason: "DP attention not needed for dp=1" };
    }
  }
  ...
};// 生成命令时,useMtp 不再要求 isPro,base 变体也可为 true
const useMtp = eagleMtp === "enabled"; // 之前是 isPro && eagleMtp === "enabled"// 同时修正了参数名
if (useMtp) {
  flags.push(" --speculative-algorithm EAGLE"); // 之前是 --speculative-algo
  flags.push(" --speculative-num-steps 3");
  flags.push(" --speculative-eagle-topk 1");
  flags.push(" --speculative-num-draft-tokens 4");
}

评论区精华

`--dp = TP / 4` 表达式歧义 documentation

reviewer(gemini-code-assist)指出表达 `--dp = TP / 4` 可能被误认为 literal 参数,建议改用文字描述如 'Set `--dp` to `TP / 4`'。

结论:PR 已合并,未看到作者明确回复,但最终文档中已调整为更自然的描述(如 'Use `--dp = TP / 4`' 似乎未改?但 review 后合并,可能视为低优先级未修改,或已隐式在后续编辑中优化)。 · 已解决

多模态 benchmark 数据无效 正确性

reviewer 注意到第 5.3.3 节的图像 benchmark 中多项指标为 0(如 generated tokens、TTFT 等),怀疑数据采集错误,要求更新。

结论:作者在后续提交(已合并)中更新了该部分数据,指标为正常值。 · 已解决

风险与影响

低风险。变更仅在 cookbook 文档和前端代码片段中,不涉及时刻运行的推理代码。主要关注点:

  • 配置迁移影响:移除禁用的理由后,base 变体用户若启用 MTP 但实际环境不支持(如缺少 Hopper 架构),可能遇到启动报错。但 cookbook 本身会校验硬件兼容性,且注释已说明。
  • 基准数据真实性:Review 中曾指出图像 benchmark 异常,已替换为正确数据,风险解除。
  • 参数名修正--speculative-algorithm 是正确参数,原 --speculative-algo 可能未被识别,修正后确保命令生效。

用户:使用 Xiaomi MiMo-V2.5(base 变体)的用户现在可以直接从 cookbook 获得 EAGLE MTP 部署命令,无需手动推断。对 Pro 用户无影响。

系统:无运行时变更,不影响现有部署。

团队:维护了 cookbook 的一致性和准确性,减少后续关于 MTP 支持能力的疑问。影响范围局限在两个文档文件。

文档配置变更 基准数据有效性曾存疑

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论