Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 10:11 同步状态:空闲 下次计划:2026-06-07 11:11
后台正在同步并分析最近 PR,页面会自动刷新并逐步显示最新结果。

PR 列表

更多筛选
2026-05-12
缺陷修复 重要性 4.76 洞察度 3.00

限制预填充 inflight 轮询警告频率

值得合并,变更安全且目标明确。建议阅读 review 讨论中关于 `KVPoll.Bootstrapping` 状态异常的跟踪 issue (#25063),以排查底层根本原因。

重构 重要性 6.08 洞察度 6.00

线性注意力后端枚举扩展自定义插件支持

值得精读。该 PR 展示了如何通过 Python 枚举的 `_missing_` 机制实现安全的插件式扩展,是一种简洁且不破坏现有 API 的设计模式。可作为 sglang 内部其他枚举扩展的参考。

#25033 Fix kimi k2.5 mla eagle + dp attention

原始 PR · 作者 Qiaolin-Yu · 合并时间 2026-05-12 11:58

缺陷修复 重要性 6.42 洞察度 3.00

修复 Kimi K2.5 MLA EAGLE 在 DP 注意力下的 embedding 越界

建议合并,该修复解决了明确的 runtime 错误。但应跟踪后续是否添加对应测试。

功能 重要性 5.03 洞察度 4.00

MUSA 平台新增 Sage Attention 后端支持

可直接合并。但对于新版 sglang 来说,建议在后续 PR 中添加 Sage Attention 后端的测试覆盖,并在文档中明确说明 Sage Attention 后端的安装要求和性能对比。此外,回退行为可考虑增加 warning 日志,以便用户及时发现配置问题。

功能 重要性 7.03 洞察度 5.00

更改 HiCache 预取超时默认值并添加上限

本 PR 是生产环境优化的重要一步,值得阅读其设计决策:引入硬上限防止长 prompt 无限等待,以及对默认超时参数的理论推导。如果有自定义预取策略的用户需要注意默认行为的变更。

参与讨论