#39842 [Model] Fix Gemma 4 token repetition by dynamic BOS injection for PT models
作者 lucianommartins · 合并时间 2026-04-16 07:13
缺陷修复
重要性 5.88
洞察度 4.00
修复Gemma 4预训练模型因缺失BOS标记导致的重复生成问题。
bugfix
v1
model
gemma
该PR值得精读,因为它展示了一个典型的模型特定修复案例:通过动态条件判断来区分模型变体(预训练 vs. 指令调优)的行为差异。关注点在于`has_chat_template`的检查逻辑如何优雅地解决双BOS与缺失BOS的权衡问题,这种模式可能适用于其他具有类似模板依赖的模型。