Prhub
← 返回仓库列表

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-04-18 22:27 同步状态:空闲 下次计划:2026-04-18 23:27

PR 列表

已合并 957 · 已分析 957
更多筛选
2026-03-23

#21200 [NPU] bugfix for import sgl-kernel error

作者 McZyWu · 合并时间 2026-03-23 19:52

缺陷修复 重要性 5.00 洞察度 4.00

修复 NPU 上因错误导入 sgl-kernel 导致的所有模型失败问题。

该 PR 值得快速浏览以了解 NPU 兼容性修复,但设计决策较简单。建议关注 review 中提出的风险,未来开发中考虑实现占位函数以提高代码健壮性。

#20316 fix fused_set_kv_buffer for rope with Ling-v2

作者 strgrb · 合并时间 2026-03-23 19:20

缺陷修复 重要性 4.00 洞察度 3.00

修复 Ling v2 模型中因 head_dim 与 rotary_dim 不匹配导致的 fused_set_kv_buffer 错误。

对于维护 bailing_moe 模型或涉及 rope kernel 和性能优化的工程师,值得快速浏览以了解条件判断的设计;对于其他用户,可视为常规 bugfix,无需深入分析。

缺陷修复 重要性 7.00 洞察度 6.00

修复NPU上minimaxm2模型准确性bug,准确率从16.5%提升至95.5%。

建议工程师精读`python/sglang/srt/hardware_backend/npu/moe/topk.py`的变更,理解条件调整如何解决准确性问题的设计决策;测试人员可参考新增测试用例扩展其他模型的覆盖。对于性能敏感场景,关注环境变量检查的潜在开销。

缺陷修复 重要性 4.00 洞察度 3.00

修复 NPU 在启用 ASCEND_USE_FIA 时 PD 分离中的 kv_item_lens 计算错误。

对于使用 NPU 和 PD 传输的开发者,建议精读此 PR 以理解 buffer 形状变化对内存计算的影响。变更简单,可作为处理硬件特定模式的示例,但无需深入分析复杂设计决策。重点关注条件分支的逻辑正确性。

缺陷修复 重要性 6.00 洞察度 6.00

修复Ngram同步竞争条件,用条件变量替代忙等待轮询。

对于涉及多线程同步或speculative decoding的开发者,此PR值得精读,可学习从轮询到条件变量的设计权衡;重点关注pending_count_管理和queue.close()行为,建议review相关代码以理解同步逻辑的演变。

#21187 ci: unify PR test suite naming

作者 merrymercy · 合并时间 2026-03-23 15:18

基础设施 重要性 4.00 洞察度 2.00

统一 CI 测试套件命名,提升命名一致性和可读性。

对于 CI 维护者和测试开发者,值得浏览以了解新的命名规范;对于一般开发者,无需深入,但可参考 .claude/skills/write-sglang-test/SKILL.md 更新后的测试编写指南。

缺陷修复 重要性 6.00 洞察度 4.00

修复上下文并行中当 tp_size 等于 attn_cp_size 时残余张量大小不匹配导致的推理崩溃。

对于维护 sglang 并行通信模块的工程师,建议精读此 PR 以理解 CP 中模式匹配和数据布局一致性的细节。变更虽小,但揭示了在并行计算中条件逻辑顺序的重要性,值得关注以防止类似错误;对于管理者,可快速合并以确保系统稳定。

基础设施 重要性 3.00 洞察度 4.00

移除显式Blackwell环境变量,改为通过CUDA能力自动检测。

这是一个小型基础设施变更,对核心业务逻辑影响有限。建议CI维护者关注此变更,以理解自动化检测机制和配置简化方向;对于一般工程师,精读价值不大,但可作为CI配置优化的案例参考。

参与讨论