Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 11:28 同步状态:空闲 下次计划:2026-06-07 12:28

PR 列表

更多筛选
2026-05-07

#20845 Fix prefill batch iter logging under overlap

原始 PR · 作者 weireweire · 合并时间 2026-05-07 17:10

缺陷修复 重要性 6.27 洞察度 5.00

修复 overlap 调度下 prefill batch 日志迭代器号错误

值得精读,特别是其设计抉择:在 run_batch 冻结快照而非 process_batch_result。理解此区别有助于掌握 overlap 调度下全局状态与局部状态的交互。

功能 重要性 7.21 洞察度 4.00

使上游 HTTP 连接池空闲超时可配置,默认50秒

本 PR 属于中等价值的改进,建议部署 SGLang Model Gateway 的团队关注并更新配置。对于开发者,可以借鉴其从常量定义到运行时消费的完整配置链路模式,以及同步更新多份文档的良好实践。不涉及复杂逻辑,无需深入代码审查。

缺陷修复 重要性 4.40 洞察度 4.00

修复 weight checker 端到端测试 OOM 并移至 nightly

无需精读,但值得关注其根因分析模式:`_check_tensors` 的 CPU→GPU 往返在低显存环境下脆弱。该 PR 展示了如何通过调整 mem-fraction 解决显存瓶颈,对类似问题有参考价值。

缺陷修复 重要性 6.33 洞察度 5.00

修复 RunAI 对象存储 URI 在多模态处理器中的解析

值得精读。该 PR 展示了如何通过提取公共函数统一多个辅助函数的 URI 处理逻辑,避免重复代码和遗漏。同时也体现了代码审查中发现模式、建议抽象的良好协作。

参与讨论