Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 13:37 同步状态：空闲下次计划：2026-06-07 14:37

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-05-16

#24732 [codex] Optimize LTX2 split rotary kernel

原始 PR · 作者 BBuf · 合并时间 2026-05-16 20:58

性能优化重要性 5.84 洞察度 6.00

优化 LTX2 分裂 RoPE Triton 内核，合并多个 head 的 launch grid

该 PR 值得精读，尤其对需要优化 Triton kernel 以利用 GPU 的开发者。核心设计决策是使用程序块合并多个 head，这是一种常见的 GPU 优化模式（减少 program 数量，增加每个 program 的工作量以更好地隐藏延迟）。自适应 warp 数量的选择也值得参考。建议在合并到主分支前，确认其他 GPU 架构（如 A100）的基准测试结果。

performancejit-kerneldiffusion

#25476 fix(pd): tolerate kv pools without end_layer (Qwen3-Next disagg)

原始 PR · 作者 whybeyoung · 合并时间 2026-05-16 19:49

缺陷修复重要性 5.05 洞察度 2.00

修复 Qwen3-Next 分离部署中 KV pool 缺少 end_layer 属性导致的崩溃

此 PR 是必须的快速修复，改动虽小但影响关键路径。建议阅读以了解类似模式的使用（getattr 防御性访问），未来在定义 KV pool 接口时注意统一属性契约。

bugfixdeepseekkv-cache

#25475 pr-states: workflow_dispatch refresh on slash cmds

原始 PR · 作者 hnyls2002 · 合并时间 2026-05-16 18:34

基础设施重要性 4.63 洞察度 5.00

PR states 工作流支持 workflow_dispatch 刷新

该 PR 是纯基础设施改进，逻辑清晰、改动适度，值得合并。建议后续 PR 处理 review 中未解决的改进建议（默认分支动态获取、覆盖 `handle_rerun_test`），它们可进一步提升健壮性和覆盖率。

infraci

#25321 [attn backend] avoid initing parent class's workspace buffer

原始 PR · 作者 Qiaolin-Yu · 合并时间 2026-05-16 18:30

性能优化重要性 6.60 洞察度 4.00

避免子类继承时重复初始化父类 workspace buffer

建议尽快合入，以减少不必要的显存占用。虽然缺少测试，但改动直观且已通过现有 CI。未来若扩展新的 MLA 后端，需注意继承时如何配置此参数。

performancerefactorblackwell

#25424 [Spec] Clean up draft-window-size handling; extract spec arg setup to arg_groups

原始 PR · 作者 hnyls2002 · 合并时间 2026-05-16 18:23

重构重要性 9.00 洞察度 6.00

将推测解码参数处理抽离为独立 hook 文件

建议精读。该 PR 展示了如何安全地进行大规模代码移动与拆分，引入 `DeprecatedAliasStoreAction` 处理参数弃用平滑过渡，以及通过 AST 验证保证重构等价性的实践，是模块化重构的优秀范例。

speculative-decodingrefactorinfra

#25473 fix(overlap): skip empty future interval for dp attention idle ranks

原始 PR · 作者 hnyls2002 · 合并时间 2026-05-16 17:08

缺陷修复重要性 4.64 洞察度 2.00

跳过 DP attention 空闲 rank 的空区间存储

建议尽快合入，属于明确的小 bugfix，补全了边界情况处理，确保与相关方法的一致性。

bugfixschedulinginfra

#25241 [diffusion] CI: fix nightly CI

原始 PR · 作者 mickqian · 合并时间 2026-05-16 16:55

缺陷修复重要性 6.96 洞察度 5.00

修复扩散 nightly CI 的端口竞争、OOM 和失败检测问题

值得精读，尤其是端口去重和 OOM 检测模式的设计，可为其他 CI 模块参考。

diffusioncibugfix

#25468 [Misc] Update release branch cut script

原始 PR · 作者 Fridge003 · 合并时间 2026-05-16 15:51

基础设施重要性 4.03 洞察度 2.00

更新 release 分支创建脚本使其支持幂等

值得合并，改动清晰且具有实际价值：避免了手动删除分支才能重跑的问题。但建议在 Workflow 注释或文档中明确说明幂等行为。