Prhub
← 返回仓库详情

标签聚合

vllm-project/vllm · 标签视图

标签列表

聚合结果

gemma 相关 PR

2026-04-16

#39842 [Model] Fix Gemma 4 token repetition by dynamic BOS injection for PT models

作者 lucianommartins · 合并时间 2026-04-16 07:13

缺陷修复 重要性 5.88 洞察度 4.00

修复Gemma 4预训练模型因缺失BOS标记导致的重复生成问题。

bugfix v1 model gemma

该PR值得精读,因为它展示了一个典型的模型特定修复案例:通过动态条件判断来区分模型变体(预训练 vs. 指令调优)的行为差异。关注点在于`has_chat_template`的检查逻辑如何优雅地解决双BOS与缺失BOS的权衡问题,这种模式可能适用于其他具有类似模板依赖的模型。