Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 12:34 同步状态:空闲 下次计划:2026-06-07 13:34

PR 列表

更多筛选
2026-04-29
缺陷修复 重要性 6.80 洞察度 6.00

修复 HiCache EAGLE 预取键不归一化的 bug

值得精读,展示了如何通过统一 key 类型(RadixKey)解决数据视图不一致导致的 bug。设计决策(bigram 视图通过 RadixKey 构造而非手动转换)值得推广。建议后续补充单元测试。

文档 重要性 2.16 洞察度 1.00

更新 Nemotron 3 Nano Omni Docker 镜像

该 PR 为纯文档修正,无需深入精读。建议维护者确保文档更新后与专用镜像的实际可用性同步。

缺陷修复 重要性 7.07 洞察度 5.00

修复 grouped_topk 负分数排序和 Mamba 填充 bug,解锁 Nemotron-3-Nano

此 PR 值得精读,尤其是 `pack_val_idx` 的 IEEE 754 位转换技巧和 CUDA graph 下的零填充模式。对于维护其他 GPU kernel 的开发者有借鉴意义。

缺陷修复 重要性 6.88 洞察度 4.00

修复 bench_long_context 因缺 request_func 导致 AttributeError

此 PR 虽然改动小但具有教学意义:展示了基类初始化逻辑变更后子类易产生隐式回归,以及如何通过单元测试捕获契约属性。建议关注 #19724 的设计改变,并考虑是否需要对其他类似的子类做审查。测试代码的编写方式值得参考。

缺陷修复 重要性 7.32 洞察度 5.00

修复 spec_accept_rate 偏差并统一命名约定

建议阅读此 PR,它修复了 spec metrics 的系统性偏差并建立了清晰的命名约定,有助于理解 sglang speculative decoding 的度量设计。但需关注测试覆盖是否充分,建议在后续 PR 中补充针对偏差修复的单元测试。

缺陷修复 重要性 7.28 洞察度 4.00

修复 multimodal embedding Jinja 模板处理

该 PR 修复了已上报 bug,解决方案稳健,测试全面,建议快速合并。值得关注的设计决策是异常处理策略和 multimodal content 构建顺序,对后续模块有参考价值。

参与讨论