#38938 Bug/test eagle dp v0
原始 PR · 作者 Monishver11 · 合并时间 2026-04-14 04:50
修复EAGLE DP推测解码测试的flaky问题,通过补全batch invariance检查和适配SM<90设备限制。
推荐精读此PR,特别是batch invariance在embedding层的实现细节,以及设备能力检测与优化禁用模式的设计决策。对于涉及推测解码、分布式测试或性能优化的开发者,此PR提供了处理类似flaky问题和权衡性能与确定性的参考案例。
参与讨论