#22842 [CPU] Add gemma4_rmsnorm_cpu kernel
作者 blzheng · 合并时间 2026-04-17 13:03
功能
重要性 7.76
洞察度 5.00
新增Gemma 4 RMSNorm CPU内核,并扩展其他归一化内核支持3D输入,修复Xeon CI失败。
sgl-kernel
cpu
feature
run-ci
建议负责CPU内核开发或模型推理优化的工程师精读此PR,重点关注`sgl-kernel/csrc/cpu/norm.cpp`中的3D输入支持设计和`python/sglang/srt/layers/layernorm.py`中的条件调用决策,这些设计模式在优化CPU计算和平衡性能与健壮性时值得借鉴。