Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 12:34 同步状态：空闲下次计划：2026-06-07 13:34

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-05-05

#24288 [SKILL] Add diffusion benchmark presets for edit and Hunyuan3D models

原始 PR · 作者 BBuf · 合并时间 2026-05-05 08:18

功能重要性 5.71 洞察度 4.00

新增 4 个 diffusion benchmark 预设（图像编辑和 3D 形状）

值得 benchmark 使用者和大模型 perf engineers 关注。PR 展示了如何通过实测数据（FireRed 1.0/1.1）做出多 GPU 策略选择（CFG parallel vs. Ulysses），以及如何用 `config_overrides` 实现模型级配置覆盖。但需注意文档与脚本的同步问题，建议采纳 review 中的修改建议。

diffusionfeaturedocumentation

#24344 [Fix] NGRAMWorker.update_weights_from_tensor — delegate to target worker

原始 PR · 作者 stargazerZJ · 合并时间 2026-05-05 07:23

缺陷修复重要性 5.59 洞察度 4.00

为 NGRAMWorker 添加 update_weights_from_tensor 委托方法

该 PR 是一个正确且简洁的修复，值得纳入。虽然变动很小，但修复了一个影响 NGRAM 可用性的关键 bug。开发者可以快速合并。

bugfixspeculative-decodingrun-ci

#24389 consolidate NSA pool construction

原始 PR · 作者 hnyls2002 · 合并时间 2026-05-05 07:04

重构重要性 6.63 洞察度 4.00

合并 NSA pool 构建分支，简化代码

作为小范围重构，代码结构清晰，值得在仓库中推广同类模式。无需深入精读，但可关注其作为 #23882 前置依赖的演进。

refactorkv-cacherun-ci

#23321 [sgl] reduce specdec cpu overhead

原始 PR · 作者 2022tgoel · 合并时间 2026-05-05 06:02

性能优化重要性 7.62 洞察度 5.00

拆分top-k选择函数减少specdec CPU开销

值得阅读，尤其是拆分torch.compile函数以减少编译开销的模式。开发者可参考此方法优化其他类似分支函数。

performancespeculative-decodingnpu

#24384 misc: add marlin to moe runner choices; drop dead env var doc

原始 PR · 作者 hnyls2002 · 合并时间 2026-05-05 06:01

缺陷修复重要性 3.51 洞察度 2.00

修复 marlin 缺失及文档清理

建议合并。该 PR 属于典型的微小修复，改动量小且明确，无需深度 review。

bugfixdocumentation

#24385 Fix sgl-deep-gemm release workflow

原始 PR · 作者 Fridge003 · 合并时间 2026-05-05 05:37

缺陷修复重要性 5.02 洞察度 4.00

修复 deep-gemm wheel 发布流程中重命名和 PyPI 上传问题

对于关注发布自动化和 CI/CD 的工程师值得精读，尤其是将操作移入容器避免环境依赖的实践。但 reviewer 建议的代码优化未纳入，建议在后续 PR 中跟进。

cidockerbugfix

#24341 Refactor device timer installation and rename prefill prealloc to bootstrap

原始 PR · 作者 merrymercy · 合并时间 2026-05-05 04:57

重构重要性 6.70 洞察度 3.00

重命名PD指标并提取设备计时器安装方法

该 PR 是适度的重构，值得学习其提取惯用法和统一命名的实践。可观测性相关开发者应关注指标名称变更，及时更新仪表盘。

refactorobservabilityscheduling

#24336 [docs]update sm75 to sm80 min gpu support

原始 PR · 作者 ppraneth · 合并时间 2026-05-05 04:50

文档重要性 1.81 洞察度 1.00

更新文档最低GPU要求为SM80

值得快速合并。建议同步检查其他文档中是否还存在 SM75 提及。

documentation

第 175 / 357 页 · 共 2850 条

上一页 1 … 173 174 175 176 177 … 357 下一页