执行摘要
为 NPU 新增 MiniMax2.5 最佳实践文档
提供 MiniMax2.5 模型在 NPU 上的最佳实践指导,便于用户复现性能和正确配置。
文档清晰实用,建议合并。
讨论亮点
无 review 讨论。
提供 MiniMax2.5 模型在 NPU 上的最佳实践指导,便于用户复现性能和正确配置。
文档清晰实用,建议合并。
无 review 讨论。
MiniMax Series Models 章节;| 文件 | 模块 | 状态 | 重要度 |
|---|---|---|---|
docs_new/docs/hardware-platforms/ascend-npus/ascend_npu_best_practice.mdx |
文档 | modified | 4.42 |
docs_new/docs/hardware-platforms/ascend-npus/ascend_npu_best_practice.mdx
documentation
唯一变更文件,新增 MiniMax2.5 最佳实践内容
{/* 新增 MiniMax Series Models 章节开头 */}
## MiniMax Series Models
### Low Latency
{/* 性能配置表格 */}
<table style={{width: "100%", borderCollapse: "collapse", tableLayout: "fixed"}}>
<colgroup>
<col style={{width: "13%"}} />
<col style={{width: "13%"}} />
<col style={{width: "13%"}} />
<col style={{width: "13%"}} />
<col style={{width: "12%"}} />
<col style={{width: "12%"}} />
<col style={{width: "12%"}} />
<col style={{width: "12%"}} />
</colgroup>
<thead>
<tr style={{borderBottom: "2px solid #d55816"}}>
<th style={{textAlign: "left", padding: "10px 12px", fontWeight: 700, whiteSpace: "nowrap", backgroundColor: "rgba(255,255,255,0.02)"}}>Model</th>
<th style={{textAlign: "left", padding: "10px 12px", fontWeight: 700, whiteSpace: "nowrap", backgroundColor: "rgba(255,255,255,0.05)"}}>Hardware</th>
<th style={{textAlign: "left", padding: "10px 12px", fontWeight: 700, whiteSpace: "nowrap", backgroundColor: "rgba(255,255,255,0.02)"}}>Cards</th>
<th style={{textAlign: "left", padding: "10px 12px", fontWeight: 700, whiteSpace: "nowrap", backgroundColor: "rgba(255,255,255,0.05)"}}>Deploy Mode</th>
<th style={{textAlign: "left", padding: "10px 12px", fontWeight: 700, whiteSpace: "nowrap", backgroundColor: "rgba(255,255,255,0.02)"}}>Dataset</th>
<th style={{textAlign: "left", padding: "10px 12px", fontWeight: 700, whiteSpace: "nowrap", backgroundColor: "rgba(255,255,255,0.05)"}}>TPOT</th>
<th style={{textAlign: "left", padding: "10px 12px", fontWeight: 700, whiteSpace: "nowrap", backgroundColor: "rgba(255,255,255,0.02)"}}>Quantization</th>
<th style={{textAlign: "left", padding: "10px 12px", fontWeight: 700, whiteSpace: "nowrap", backgroundColor: "rgba(255,255,255,0.05)"}}>Configuration</th>
</tr>
</thead>
<tbody>
<tr>
<td>MiniMax-M2.5</td>
<td>Atlas 800I A3</td>
<td>8</td>
<td>PD Mixed</td>
<td>3.5K+1.5K</td>
<td>20ms</td>
<td>W8A8 INT8</td>
<td><a href="#minimax-m25-3_5k-1_5k-low-latency-on-a3-8-cards-mixed-mode">Optimal Configuration</a></td>
</tr>
</tbody>
</table>当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。
纯文档变更,无技术风险。
影响使用 NPU 部署 MiniMax2.5 模型的用户,提供可参考的配置和性能预期。
当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。
参与讨论