Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-04-20 06:55 同步状态:空闲 下次计划:2026-04-20 07:55

PR 列表

已合并 966 · 已分析 966
更多筛选
2026-04-06
缺陷修复 重要性 5.00 洞察度 4.00

修复 setuptools-scm 版本解析中 rc 标签排序错误,确保 PyPI 发布构建正确版本。

建议技术管理者审查 `python/tools/get_version_tag.py` 脚本的健壮性,特别是版本解析和祖先检查逻辑。工程师可参考此 PR 学习如何处理 git 标签排序和跨工作流版本控制,值得精读以理解基础设施改进策略。

#22131 Hisparse Minor Fix

原始 PR · 作者 xiezhq-hermann · 合并时间 2026-04-06 07:15

缺陷修复 重要性 5.00 洞察度 6.00

修复Hisparse JIT内核内存传输和调度器请求回收逻辑,提升性能和正确性。

该PR值得关注,特别是JIT内核的128位传输优化设计,展示了CUDA编程中内存对齐和批量传输的技巧。建议重点阅读hisparse.cuh的transfer_item_warp函数变更,理解其如何避免对齐问题并提升吞吐。同时注意review中未解决的健壮性问题,未来若扩展使用场景需考虑尾部处理。

基础设施 重要性 3.00 洞察度 3.00

将CI自动二分法的最小失败连续次数从2降为1,确保所有失败都被分析。

该PR变更简单直接,适合快速浏览以了解CI监控策略的调整。值得关注的是review中揭示的“默认值一致性”问题,提醒开发者在修改默认参数时需检查所有相关入口点。对于负责CI基础设施的工程师,建议了解此变更对资源使用的影响。

缺陷修复 重要性 3.00 洞察度 2.00

修复语法后端单元测试中think_end_id参数传递问题,确保测试与PR#22148变更对齐。

该PR变更简单直接,无需精读。对于关注测试维护和CI稳定性的工程师,可以快速浏览以了解think_end_id参数传递方式的变化。对于不直接涉及语法后端测试的开发者,可以忽略此PR。

缺陷修复 重要性 6.00 洞察度 7.00

修复TRT-LLM MHA在EAGLE v2推测解码+DP注意力下因批次大小不一致导致的CUDA非法地址错误。

该PR值得精读,尤其关注:1) DP注意力下批次大小不一致的根本原因分析;2) 从forward_batch.batch_size到元数据推导的设计决策,体现了与其他后端行为对齐的架构一致性;3) review中关于填充目的和注意力独立性的讨论,有助于理解分布式推理中的数据流设计。

#22134 [Hotfix] Fix router gemm on sm103

原始 PR · 作者 Fridge003 · 合并时间 2026-04-06 00:33

缺陷修复 重要性 5.00 洞察度 4.00

修复DeepSeek-V2模型在SM103设备上路由器GEMM内核优化条件,避免潜在兼容性问题。

该PR值得快速浏览,特别是对于维护DeepSeek模型或硬件兼容性代码的工程师。虽然变更简单,但揭示了硬件特定优化中的微妙权衡:在修复已知问题的同时,可能无意中排除了其他类似设备。建议关注后续是否有更全面的硬件兼容性测试或条件优化策略。

2026-04-05
测试 重要性 3.00 洞察度 4.00

为Qwen3 Next MTP模型重新启用SpecV2的KL散度准确性测试。

该PR变更简单,值得快速浏览以了解测试恢复的背景。重点关注KLDivergenceMixin的设计和阈值设置,以及review中关于测试方法执行的讨论。

参与讨论