Prhub

vllm-project/vllm · 标签视图

标签列表

聚合结果

pipeline-parallelism 相关 PR

2026-04-29

#40786 Fix PP in Gemma4

原始 PR · 作者 SKRohit · 合并时间 2026-04-29 18:17

缺陷修复 重要性 6.58 洞察度 5.00

修复 Gemma4 PP 中 residual 和 per_layer_inputs 同步

建议阅读此 PR 以了解 Gemma4 在 PP 下的张量同步设计,特别是 IntermediateTensors 如何按需传递。对于有类似 PP + PLE 实现的模型开发者,这是一个值得关注的决策案例——如何平衡泛化与模型特定优化。