Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 12:34 同步状态:空闲 下次计划:2026-06-07 13:34

PR 列表

更多筛选
2026-05-13
缺陷修复 重要性 6.96 洞察度 5.00

修复NIXL FILE传输文件描述符泄漏

该 PR 是一个典型的资源泄漏修复案例,设计上采用最小变更 + 回归测试的策略值得参考。建议关注作者后续的重构 commit,以了解如何系统性解决 `NixlFileManager` 的资源管理问题。

添加 _skip_rope_for_aiter_fused_mla 避免 gfx950 上的双重复旋转

值得精读。该 PR 展示了如何从临时环境变量方案演进为结构性修复,是设计决策的良好案例。特别关注 `_skip_rope_for_aiter_fused_mla` 方法的定义和它在 `forward_absorb_prepare` 中的插入点,理解条件判断的边界。

#25129 Update flashinfer to 0.6.11.post1

原始 PR · 作者 Fridge003 · 合并时间 2026-05-13 15:12

dependencies 重要性 4.82 洞察度 2.00

升级flashinfer至0.6.11.post1

该PR是常规的依赖版本升级,可以直接合并。开发者无需深入审查。

功能 重要性 6.46 洞察度 6.00

支持MoRI EP的FP8 blockwise量化combine

值得精读。展示了如何用枚举替换布尔标志提升可扩展性,以及如何与外部库协作安全引入新量化模式。尤其适合关注 AMD 平台性能优化的工程师。

缺陷修复 重要性 5.18 洞察度 4.00

禁用AMD DeepSeek-V4测试的unittest fail-fast

该 PR 展示了处理 CI 框架与测试用例需求冲突的巧妙方法(通过运行时过滤 sys.argv),值得测试维护人员注意。环境变量的同步更新也反映了对 AMD 平台最新优化配置的跟进。建议未来考虑将精度测试和性能测试拆分为独立文件,以更根本地避免此类问题。

参与讨论