Prhub

vllm-project/vllm · 标签视图

标签列表

聚合结果

dflash 相关 PR

2026-05-28
缺陷修复 重要性 6.05 洞察度 5.00

修复DFlash前瞻槽位分配以解决崩溃

此PR虽然改动量小,但涉及投机解码与调度器交互的关键逻辑,值得精读。特别是`effective_lookahead_tokens`的条件演进和DFlash特殊需求的论证,可作为类似bug修复的参考。

2026-05-20
缺陷修复 重要性 6.15 洞察度 7.00

修复 DFlash 辅助层索引偏移 1 的问题

值得精读,尤其是配置层与运行时层如何通过双向偏移解决第三方模型与框架索引约定不一致的设计模式。Review 中的讨论展示了如何通过仔细的防御性编程防止空值引起的回归。

2026-05-15

#42692 [Bugfix] DFlash FP8 KV-Cache

原始 PR · 作者 benchislett · 合并时间 2026-05-15 22:29

缺陷修复 重要性 5.46 洞察度 4.00

修复 DFlash 与 FP8 KV-Cache 的兼容性崩溃

值得精读,展示了推测解码与 KV-Cache 量化组合时常见的配置传递遗漏问题,可作为类似集成场景的参考。