#7467 [Speculative Decoding][BugFix] Fix apply repeat times penalty kernel and change spec default verify strategy
作者 freeliuzc · 合并时间 2026-04-18 00:38
修复投机解码重复惩罚核函数越界访问,并将默认验证策略改为target_match。
该PR值得精读,特别是CUDA核函数修复部分,展示了在并行计算中处理边界条件的常见陷阱。关注点:1. `update_repeat_times`核函数中循环上界从`length_id`到`cur_len[bi]`的变更逻辑;2. 默认配置变更的设计决策,反映了项目对常用功能的优化。建议结合review评论,补充相关测试和文档更新。
参与讨论