Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 11:28 同步状态:空闲 下次计划:2026-06-07 12:28

PR 列表

更多筛选
2026-05-25
缺陷修复 重要性 6.60 洞察度 4.00

修复 DSv4 非 cuda-graph 路径下 multi-step draft 的 KV 写入布局错误

建议合并。该修复针对明确 bug,方案简洁且提取了共享逻辑,有助于后期维护。后续可考虑增加测试覆盖非 cuda-graph 的 draft 路径。

功能 重要性 5.56 洞察度 6.00

新增 opt-out 开关跳过 SP gather 路径

该 PR 值得精读,尤其是需要优化解码性能或集成新模型的工程师: - 学习如何通过短小精悍的配置项绕过对性能有害的通用路径。 - 关注 `require_attn_tp_gather` 的短路模式,可作为类似优化的模板。

#26205 Clean up server startup log noise

原始 PR · 作者 merrymercy · 合并时间 2026-05-25 05:35

重构 重要性 6.02 洞察度 5.00

合并降级启动日志,消除约27行噪声

推荐阅读,作为日志清理的典范,展示了如何平衡可见性与噪声控制。

缺陷修复 重要性 5.03 洞察度 3.00

修复 TVM FFI 导入在 Intel GPU 上的兼容问题

该 PR 修改简洁明确,值得快速合并。虽然讨论中提出了长期方案,但当前修复是必要的兼容性适配,建议阅读作为 Intel GPU 支持系列的一部分。

#25948 [dsv4] support eplb

原始 PR · 作者 SYChen123 · 合并时间 2026-05-25 01:09

功能 重要性 6.50 洞察度 4.00

支持 DeepSeek-V4 EPLB 专家负载均衡

值得 merge。修复了里程碑模型 DSV4 的 EPLB 功能,改动小而精准。建议补充 EPLB 相关的集成测试以覆盖未来回归。

参与讨论