#42180 docs: clarify Gemma 4 assistant speculative decoding
原始 PR · 作者 AbhiOnGithub · 合并时间 2026-05-10 11:08
文档
重要性 2.82
洞察度 4.00
澄清 Gemma 4 辅助模型须用 MTP 路径
建议精读。该 PR 是处理“文档与实现不一致”的标准范例,值得其他特性维护者参考。
标签列表
聚合结果
原始 PR · 作者 AbhiOnGithub · 合并时间 2026-05-10 11:08
澄清 Gemma 4 辅助模型须用 MTP 路径
建议精读。该 PR 是处理“文档与实现不一致”的标准范例,值得其他特性维护者参考。
原始 PR · 作者 lucianommartins · 合并时间 2026-05-05 12:34
修复 Gemma4 MoE 激活函数为 tanh 近似 GELU
该 PR 设计清晰、改动集中,已获得批准。建议团队在合入后验证 Gemma4 模型生成质量无明显波动,并确认 LoRA 相关测试通过。
修复 Gemma 4 MoE 专家捕获器配置键不兼容
此 PR 值得快速合并,修复明确且影响范围小。建议未来在模型配置兼容性改进中考虑添加单元测试(如测试 `_get_num_experts_per_tok` 对不同配置的响应),避免类似回归。