#22413 [CPU] Add apply_routed_scaling_factor_on_output support for biased_grouped_topk fusion
作者 jianan-gu · 合并时间 2026-04-10 15:16
为CPU路径添加路由缩放因子支持,扩展fp32数据类型,并优化MoE topk融合。
该PR值得精读,特别是sgl-kernel/csrc/cpu/topk.cpp中的内核实现变更,展示了如何优化CPU路径的MoE topk融合以支持新功能。关注宏重构的设计决策,以及测试用例的扩展方法,可作为类似内核优化的参考。
参与讨论