#35549 [MoE Refactor] Refactor ZeroExpertFusedMoE into new framework
作者 bnellnm · 合并时间 2026-04-15 04:11
重构MoE零专家处理逻辑,将ZeroExpertFusedMoE功能移至新框架。
建议精读此PR,关注ZeroExpertRouter的设计(如路由与零专家计算结合)和MoERunnerBase的扩展(_maybe_add_zero_expert_output方法),这些决策体现了模块化架构思想,对理解vLLM的MoE实现和未来重构有重要参考价值。
参与讨论