#23631 [HiCache][SPEC] fix: normalize storage prefetch key
原始 PR · 作者 alphabetc1 · 合并时间 2026-04-29 06:53
修复 HiCache EAGLE 预取键不归一化的 bug
值得精读,展示了如何通过统一 key 类型(RadixKey)解决数据视图不一致导致的 bug。设计决策(bigram 视图通过 RadixKey 构造而非手动转换)值得推广。建议后续补充单元测试。
SGLang is a high-performance serving framework for large language models and multimodal models.
原始 PR · 作者 alphabetc1 · 合并时间 2026-04-29 06:53
修复 HiCache EAGLE 预取键不归一化的 bug
值得精读,展示了如何通过统一 key 类型(RadixKey)解决数据视图不一致导致的 bug。设计决策(bigram 视图通过 RadixKey 构造而非手动转换)值得推广。建议后续补充单元测试。
更新 Nemotron 3 Nano Omni Docker 镜像
该 PR 为纯文档修正,无需深入精读。建议维护者确保文档更新后与专用镜像的实际可用性同步。
修复 grouped_topk 负分数排序和 Mamba 填充 bug,解锁 Nemotron-3-Nano
此 PR 值得精读,尤其是 `pack_val_idx` 的 IEEE 754 位转换技巧和 CUDA graph 下的零填充模式。对于维护其他 GPU kernel 的开发者有借鉴意义。
修复 bench_long_context 因缺 request_func 导致 AttributeError
此 PR 虽然改动小但具有教学意义:展示了基类初始化逻辑变更后子类易产生隐式回归,以及如何通过单元测试捕获契约属性。建议关注 #19724 的设计改变,并考虑是否需要对其他类似的子类做审查。测试代码的编写方式值得参考。
修复 spec_accept_rate 偏差并统一命名约定
建议阅读此 PR,它修复了 spec metrics 的系统性偏差并建立了清晰的命名约定,有助于理解 sglang speculative decoding 的度量设计。但需关注测试覆盖是否充分,建议在后续 PR 中补充针对偏差修复的单元测试。
原始 PR · 作者 alphabetc1 · 合并时间 2026-04-29 05:06
修复 page 对齐后空 key 索引越界
可直接合并。改动简洁清晰,修复了一个明确的边界条件 bug。建议后续补充针对空 key 或短 key 的单元测试,以防未来重构引入类似问题。
修复 NVFP4 量化导致 Qwen3.5 精度下降
建议精读该 PR 以理解 SGLang 量化打包映射的工作原理。虽然改动简单,但涉及量化精度关键设计,值得关注。
原始 PR · 作者 robellliu-dev · 合并时间 2026-04-29 04:05
修复 multimodal embedding Jinja 模板处理
该 PR 修复了已上报 bug,解决方案稳健,测试全面,建议快速合并。值得关注的设计决策是异常处理策略和 multimodal content 构建顺序,对后续模块有参考价值。
参与讨论