#23037 [Bug Fix] Resolve EAGLE cuda graph IMA under PD + DP + MTP with GLM-5.1
原始 PR · 作者 zRzRzRzRzRzRzR · 合并时间 2026-05-02 04:53
修复 EAGLE cuda graph 因 padding 残留和视图别名导致的 OOB
建议快速合并,该修复解决了实际运行中频繁崩溃的已知问题。值得关注的设计决策:1) 清零填充区域 vs 让下游 gather 感知 padding 的权衡;2) 使用 maybe_detect_oob 代替 clamp/assert 以避免 GPU-CPU 同步。
参与讨论