Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 12:34 同步状态:空闲 下次计划:2026-06-07 13:34

PR 列表

更多筛选
2026-05-05
功能 重要性 5.71 洞察度 4.00

新增 4 个 diffusion benchmark 预设(图像编辑和 3D 形状)

值得 benchmark 使用者和大模型 perf engineers 关注。PR 展示了如何通过实测数据(FireRed 1.0/1.1)做出多 GPU 策略选择(CFG parallel vs. Ulysses),以及如何用 `config_overrides` 实现模型级配置覆盖。但需注意文档与脚本的同步问题,建议采纳 review 中的修改建议。

#24389 consolidate NSA pool construction

原始 PR · 作者 hnyls2002 · 合并时间 2026-05-05 07:04

重构 重要性 6.63 洞察度 4.00

合并 NSA pool 构建分支,简化代码

作为小范围重构,代码结构清晰,值得在仓库中推广同类模式。无需深入精读,但可关注其作为 #23882 前置依赖的演进。

#23321 [sgl] reduce specdec cpu overhead

原始 PR · 作者 2022tgoel · 合并时间 2026-05-05 06:02

性能优化 重要性 7.62 洞察度 5.00

拆分top-k选择函数减少specdec CPU开销

值得阅读,尤其是拆分torch.compile函数以减少编译开销的模式。开发者可参考此方法优化其他类似分支函数。

#24385 Fix sgl-deep-gemm release workflow

原始 PR · 作者 Fridge003 · 合并时间 2026-05-05 05:37

缺陷修复 重要性 5.02 洞察度 4.00

修复 deep-gemm wheel 发布流程中重命名和 PyPI 上传问题

对于关注发布自动化和 CI/CD 的工程师值得精读,尤其是将操作移入容器避免环境依赖的实践。但 reviewer 建议的代码优化未纳入,建议在后续 PR 中跟进。

参与讨论