#39045 [Gemma4] Support quantized MoE
作者 dsikka · 合并时间 2026-04-09 09:57
功能
重要性 5.00
洞察度 5.00
支持Gemma4量化MoE模型权重加载,扩展2D量化专家参数映射逻辑。
quantization
model
v1
gemma4
该PR值得精读,特别是权重映射和正则表达式重映射的设计决策,展示了如何处理量化参数与原始权重的命名差异。关注`load_weights`中的前缀匹配逻辑和`_weight_iterator`中的重映射策略。