#37990 [MoE refactor] refactor GPTQMarlinMoEMethod with MK
原始 PR · 作者 jikunshang · 合并时间 2026-04-23 13:21
重构GPTQMarlinMoEMethod以使用modular kernel框架,引入WNA16 MoE oracle后端选择。
该PR值得精读以了解oracle设计模式和modular kernel集成。关注`int_wna16.py`中的后端选择逻辑、层无关性实现,以及review中讨论的LoRA支持和回退路径问题,这些是未来类似重构的关键决策点。
参与讨论