Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-13 17:27 同步状态：空闲下次计划：2026-06-13 18:27

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-05-05

#24385 Fix sgl-deep-gemm release workflow

原始 PR · 作者 Fridge003 · 合并时间 2026-05-05 05:37

缺陷修复重要性 5.02 洞察度 4.00

修复 deep-gemm wheel 发布流程中重命名和 PyPI 上传问题

对于关注发布自动化和 CI/CD 的工程师值得精读，尤其是将操作移入容器避免环境依赖的实践。但 reviewer 建议的代码优化未纳入，建议在后续 PR 中跟进。

cidockerbugfix

#24341 Refactor device timer installation and rename prefill prealloc to bootstrap

原始 PR · 作者 merrymercy · 合并时间 2026-05-05 04:57

重构重要性 6.70 洞察度 3.00

重命名PD指标并提取设备计时器安装方法

该 PR 是适度的重构，值得学习其提取惯用法和统一命名的实践。可观测性相关开发者应关注指标名称变更，及时更新仪表盘。

refactorobservabilityscheduling

#24336 [docs]update sm75 to sm80 min gpu support

原始 PR · 作者 ppraneth · 合并时间 2026-05-05 04:50

文档重要性 1.81 洞察度 1.00

更新文档最低GPU要求为SM80

值得快速合并。建议同步检查其他文档中是否还存在 SM75 提及。

documentation

#24369 [Docker] fix: install nixl stub alongside nixl-cuXX binary

原始 PR · 作者 Kangyan-Zhou · 合并时间 2026-05-05 03:46

缺陷修复重要性 3.30 洞察度 5.00

Docker 中恢复 nixl stub 包安装

该 PR 修复了一个关键的回归问题，建议精读以了解 nixl 包的结构和安装最佳实践。

dockerbugfix

#22055 [HiCache] return cached_tokens_details in sglext for streaming responses

原始 PR · 作者 vladnosiv · 合并时间 2026-05-05 03:30

缺陷修复重要性 7.74 洞察度 5.00

修复流式响应中 cached_tokens_details 在 sglext 中缺失的问题

值得精读，因为展示了如何修复流式响应中字段缺失的常见模式，以及如何重构共享逻辑。设计决策：将辅助函数提取到 utils.py 以便复用，以及将 routed_experts 和 cached_tokens_details 合并到一个 sglext 块中。

hicachebugfixtest

#24374 [CI] Exclude flaky h20 stage from check-stage-health root cause set

原始 PR · 作者 Kangyan-Zhou · 合并时间 2026-05-05 02:41

基础设施重要性 2.92 洞察度 2.00

排除不稳定的 h20 阶段引发级联失败

此 PR 是小幅 CI 可靠性改进，值得合并。建议关注 h20 运行器 GPU 残留的根本原因，并考虑更长期的修复。

cibugfix

#24359 Minor scheduler fixes

原始 PR · 作者 ispobock · 合并时间 2026-05-05 02:01

缺陷修复重要性 5.55 洞察度 4.00

优化混合SWA预fill及容量检查

值得合并的微小修复，逻辑清晰。建议在合并前添加针对混合 SWA 及非 PP 场景下 `get_num_allocatable_reqs` 行为的单元测试，尤其是边界 case（token pool 接近耗尽）。

schedulingbugfixrun-ci

#24156 Cache FlashInfer autotune configs

原始 PR · 作者 sshleifer · 合并时间 2026-05-05 02:00

性能优化重要性 7.25 洞察度 7.00

缓存 FlashInfer 自动调优配置

值得精读。该 PR 展示了如何通过简单的缓存机制显著优化模型初始化性能，设计上考虑了多维度缓存键和并发安全，是性能优化的良好范例。

performancejit-kernelrun-ci

第 215 / 396 页 · 共 3165 条

上一页 1 … 213 214 215 216 217 … 396 下一页