#39684 [Compilation] Refactor SiluMul activation+quant Fusion Pass
原始 PR · 作者 BadrBasowid · 合并时间 2026-04-23 21:10
重构 SiluMul 激活与量化融合 pass,统一注册框架
该 PR 值得所有关心 vllm 编译优化和代码架构的开发者精读。 - 展示了如何将现有代码平滑迁移到 `VllmPatternReplacement` / `VllmFusionPatternMatcherPass` 框架。 - 设计上通过 `pattern` 和 `replacement` 属性分离模式定义,避免了手工调用 `register_replacement`,提高了可读性。 - 测试中的特殊处理虽然临时,但作者已承诺统一,社区可以跟进。 - 建议学习其拆分思路,未来新 fusion pass 应直接使用该模式。
参与讨论