#43909 [Bug] Fix gemma4 MTP IMA issue when TP>1, `CUDA error: an illegal memory access was encountered`
原始 PR · 作者 yewentao256 · 合并时间 2026-05-30 22:34
修复 Gemma4 MTP TP>1 时 CUDA 非法内存访问
值得精读。该 PR 展示了 CUDA graph replay 场景下的经典问题:中间张量生命周期短于 graph 重放周期,导致非法内存访问。采用缓存 tensor 并确保 contiguous 的修复模式可作为团队内部处理类似问题的参考。
参与讨论