Prhub

#26725 【NPU】add MiniMax2.5 best practice docs

原始 PR 作者 shadowxz109 合并时间 2026-06-01 10:09 文件变更 1 提交数 1 评论 2 代码增减 +923 / -0

执行摘要

为 NPU 新增 MiniMax2.5 最佳实践文档

提供 MiniMax2.5 模型在 NPU 上的最佳实践指导,便于用户复现性能和正确配置。

文档清晰实用,建议合并。

讨论亮点

无 review 讨论。

实现拆解

  1. 在文档末尾新增 MiniMax Series Models 章节;
  2. 提供低延迟配置表格,包含模型、硬件、卡数、部署模式、数据集长度、TPOT、量化方式和配置链接;
  3. 后续段落(patch 后续部分)可能包含启动参数示例等详细配置。
文件 模块 状态 重要度
docs_new/docs/hardware-platforms/ascend-npus/ascend_npu_best_practice.mdx 文档 modified 4.42

关键源码片段

docs_new/docs/hardware-platforms/ascend-npus/ascend_npu_best_practice.mdx documentation

唯一变更文件,新增 MiniMax2.5 最佳实践内容

{/* 新增 MiniMax Series Models 章节开头 */}
## MiniMax Series Models

### Low Latency

{/* 性能配置表格 */}
<table style={{width: "100%", borderCollapse: "collapse", tableLayout: "fixed"}}>
  <colgroup>
    <col style={{width: "13%"}} />
    <col style={{width: "13%"}} />
    <col style={{width: "13%"}} />
    <col style={{width: "13%"}} />
    <col style={{width: "12%"}} />
    <col style={{width: "12%"}} />
    <col style={{width: "12%"}} />
    <col style={{width: "12%"}} />
  </colgroup>
  <thead>
    <tr style={{borderBottom: "2px solid #d55816"}}>
      <th style={{textAlign: "left", padding: "10px 12px", fontWeight: 700, whiteSpace: "nowrap", backgroundColor: "rgba(255,255,255,0.02)"}}>Model</th>
      <th style={{textAlign: "left", padding: "10px 12px", fontWeight: 700, whiteSpace: "nowrap", backgroundColor: "rgba(255,255,255,0.05)"}}>Hardware</th>
      <th style={{textAlign: "left", padding: "10px 12px", fontWeight: 700, whiteSpace: "nowrap", backgroundColor: "rgba(255,255,255,0.02)"}}>Cards</th>
      <th style={{textAlign: "left", padding: "10px 12px", fontWeight: 700, whiteSpace: "nowrap", backgroundColor: "rgba(255,255,255,0.05)"}}>Deploy Mode</th>
      <th style={{textAlign: "left", padding: "10px 12px", fontWeight: 700, whiteSpace: "nowrap", backgroundColor: "rgba(255,255,255,0.02)"}}>Dataset</th>
      <th style={{textAlign: "left", padding: "10px 12px", fontWeight: 700, whiteSpace: "nowrap", backgroundColor: "rgba(255,255,255,0.05)"}}>TPOT</th>
      <th style={{textAlign: "left", padding: "10px 12px", fontWeight: 700, whiteSpace: "nowrap", backgroundColor: "rgba(255,255,255,0.02)"}}>Quantization</th>
      <th style={{textAlign: "left", padding: "10px 12px", fontWeight: 700, whiteSpace: "nowrap", backgroundColor: "rgba(255,255,255,0.05)"}}>Configuration</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <td>MiniMax-M2.5</td>
      <td>Atlas 800I A3</td>
      <td>8</td>
      <td>PD Mixed</td>
      <td>3.5K+1.5K</td>
      <td>20ms</td>
      <td>W8A8 INT8</td>
      <td><a href="#minimax-m25-3_5k-1_5k-low-latency-on-a3-8-cards-mixed-mode">Optimal Configuration</a></td>
    </tr>
  </tbody>
</table>

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

纯文档变更,无技术风险。

影响使用 NPU 部署 MiniMax2.5 模型的用户,提供可参考的配置和性能预期。

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论