#20845 Fix prefill batch iter logging under overlap
原始 PR · 作者 weireweire · 合并时间 2026-05-07 17:10
修复 overlap 调度下 prefill batch 日志迭代器号错误
值得精读,特别是其设计抉择:在 run_batch 冻结快照而非 process_batch_result。理解此区别有助于掌握 overlap 调度下全局状态与局部状态的交互。
SGLang is a high-performance serving framework for large language models and multimodal models.
原始 PR · 作者 weireweire · 合并时间 2026-05-07 17:10
修复 overlap 调度下 prefill batch 日志迭代器号错误
值得精读,特别是其设计抉择:在 run_batch 冻结快照而非 process_batch_result。理解此区别有助于掌握 overlap 调度下全局状态与局部状态的交互。
原始 PR · 作者 polisettyvarma · 合并时间 2026-05-07 13:45
修复 Intel XPU 上 MLA workspace 计算错误
该 PR 是 Intel XPU 平台的关键修正,解决了平台差异导致的正确性问题。值得关注其参数替换思路,为后续多平台适配提供参考。
原始 PR · 作者 Kangyan-Zhou · 合并时间 2026-05-07 13:24
修复 NeMo-Skills 安装因上游改动的依赖冲突
简单但必要的 CI 稳定性修复,值得快速合并。后续可考虑更稳健的依赖管理策略,如使用 lock 文件或定期自动更新固定 commit。
修复多节点 LoRA 的 lora_id 不一致问题
可安全合并。建议为 `deterministic_id` 添加单元测试,并考虑扩展至多节点 LoRA 的集成测试。
原始 PR · 作者 revanthreddy-hai · 合并时间 2026-05-07 13:11
使上游 HTTP 连接池空闲超时可配置,默认50秒
本 PR 属于中等价值的改进,建议部署 SGLang Model Gateway 的团队关注并更新配置。对于开发者,可以借鉴其从常量定义到运行时消费的完整配置链路模式,以及同步更新多份文档的良好实践。不涉及复杂逻辑,无需深入代码审查。
新增 bypass-fastfail 标签跳过 CI 跨作业失败检查
简单实用的 CI 改进,值得合并。
修复 weight checker 端到端测试 OOM 并移至 nightly
无需精读,但值得关注其根因分析模式:`_check_tensors` 的 CPU→GPU 往返在低显存环境下脆弱。该 PR 展示了如何通过调整 mem-fraction 解决显存瓶颈,对类似问题有参考价值。
原始 PR · 作者 junliu-mde · 合并时间 2026-05-07 10:20
修复 RunAI 对象存储 URI 在多模态处理器中的解析
值得精读。该 PR 展示了如何通过提取公共函数统一多个辅助函数的 URI 处理逻辑,避免重复代码和遗漏。同时也体现了代码审查中发现模式、建议抽象的良好协作。
参与讨论