#21040 [AMD][MoRI] Auto-select dispatch quantization type from MoE weight dtype.
作者 Duyi-Wang · 合并时间 2026-03-25 13:53
MoRI EP 自动从 MoE 权重 dtype 检测 dispatch quantization 类型,简化用户配置。
建议精读 `moriep.py` 中的 `set_quant_config` 和懒初始化设计,以理解如何实现自动检测和延迟创建 MoRI 操作,这对于学习量化路径选择机制和 AMD MoE 优化有价值。
参与讨论