#37873 [Bugfix] RoBERTa position_id accumulation in CUDA graph padding region
原始 PR · 作者 yanghui1-arch · 合并时间 2026-03-23 22:59
修复RoBERTa模型在CUDA图模式下位置ID累积导致的崩溃问题。
建议工程师精读此PR,理解CUDA图模式下tensor重用和模型特定逻辑的交互。重点关注设计决策:选择在model runner中修复而非模型层,以预防未来类似bug。变更虽小,但揭示了优化场景下的微妙陷阱,值得学习以增强代码健壮性。
参与讨论