#7133 Revert "[BugFix][Speculative Decoding] Correct index calculation in speculate decoding operators"
作者 yuanlehome · 合并时间 2026-04-01 21:54
回滚推测解码算子索引修复,恢复CUDA kernel与Python参考实现对齐。
该PR值得技术管理者关注,因为它涉及核心推测解码算子的行为变更。建议: 1. **精读重点**:关注`speculate_set_stop_value_multi_seqs.cu`中的索引计算逻辑变化,理解回滚前后的差异。 2. **调查原因**:联系作者或相关团队了解回滚的具体原因,评估是否需要在后续PR中重新修复。 3. **验证测试**:确保单元测试充分覆盖回滚后的场景,避免测试用例本身存在逻辑问题。
参与讨论