Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 12:34 同步状态:空闲 下次计划:2026-06-07 13:34

PR 列表

更多筛选
2026-05-11
缺陷修复 重要性 4.53 洞察度 3.00

修复 CI 中 sgl-kernel-mla-test 路径错误

建议快速合并此 PR,因为它修复了阻塞所有 PR 的 CI 回归问题。同时值得关注的是优化路径过滤的设计决策:避免纯配置变更触发昂贵构建,这是一个良好的 CI 实践。

缺陷修复 重要性 5.12 洞察度 3.00

修复 Flashinfer A2A 调度中 padding slot 导致的 NaN

该 PR 为典型的单行关键 bugfix,推荐阅读以理解 A2A 调度中 padding slot sanitize 的必要性。设计上的教训是:新参数默认值应为安全值(如 -1),而不是跳过清理。值得关注的决策:通过修改 dispatch 调用而非修改 dispatcher 内部逻辑,保持了最小侵入性。

缺陷修复 重要性 4.71 洞察度 4.00

修复 AMD CI DSv4 参数回退和 cron 续跑问题

推荐 AMD 和 CI 维护者关注本次 continue-on-error 条件的设计模式(`github.event_name == 'schedule'`),以及跨分支配置兼容性处理。对于其他硬件后端,可借鉴类似的条件感知方式。本 PR 改动直观、测试充分,值得精读。

#24876 [Docs] Add MiniCPM-V 4.6 cookbook

原始 PR · 作者 AgainstEntropy · 合并时间 2026-05-11 12:32

文档 重要性 7.33 洞察度 5.00

添加 MiniCPM-V 4.6 cookbook 文档

值得阅读,尤其是交互式 Deployment 组件的实现方式可作为后续文档交互模式的参考。设计决策(如按硬件区分 attention backend、reasoning parser 与 tool call parser 的组合逻辑)清晰反映了 SGLang 对多模态模型实际部署的推荐配置。

性能优化 重要性 6.75 洞察度 5.00

融合算子加速 NPU Wan 推理 2%-10%

该 PR 展示了如何为 NPU 后端添加融合算子路径,具有参考价值。但 review 中的重构建议未被采纳,对于追求高代码质量的团队尤其值得注意。整体改动较小,建议关注其中的模式设计。

#24916 ci: run H20 stage with CUDA 13

原始 PR · 作者 HanHan009527 · 合并时间 2026-05-11 11:18

基础设施 重要性 2.44 洞察度 1.00

H20 CI 阶段默认 CUDA 版本升级至 13.0

该 PR 为简单的 CI 配置修复,无需精读代码。但体现了团队维护 CI 环境同步的务实做法,对于关注 CI 稳定性的读者有参考价值。

参与讨论