Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-14 23:13 同步状态:空闲 下次计划:2026-06-15 00:13

PR 列表

更多筛选
2026-04-01
缺陷修复 重要性 5.00 洞察度 3.00

修复 Docker 镜像中的安全漏洞和构建错误,显著降低 CVE 数量。

建议安全团队和 DevOps 工程师精读此 PR,特别是关注 Dockerfile 中构建优化和清理机制的设计,以及依赖升级的版本管理,有助于提高容器化部署的最佳实践。

#17122 [bugfix]GLM-4V model

原始 PR · 作者 KnightLTC · 合并时间 2026-04-01 10:37

缺陷修复 重要性 5.00 洞察度 3.00

修复GLM-4V模型在VisionAttention中因num_dummy_heads计算缺失导致的dist_utils.divide异常。

对于从事NPU开发、多模态模型维护或视觉语言模型集成的工程师,建议精读此PR以理解num_dummy_heads参数传递和硬件兼容性处理;同时关注测试准确性问题的后续解决。

#21763 [diffusion] CI: improve ci reliability

原始 PR · 作者 mickqian · 合并时间 2026-04-01 10:06

基础设施 重要性 5.00 洞察度 5.00

为扩散测试添加URL下载重试和超时错误处理,提高CI稳定性。

建议阅读者关注重试机制的设计和异常处理细节,注意review中提到的潜在问题,对于类似CI改进项目,此PR展示了如何通过代码优化提升测试稳定性。

功能 重要性 4.00 洞察度 3.00

为 run_eval 添加延迟和吞吐量指标,支持 CI 回归检查。

建议对 CI 工程师和测试开发者精读,以了解新的 metrics 计算方式;对于其他开发者,快速浏览即可。

功能 重要性 5.00 洞察度 5.00

为diffusion服务器添加uvicorn访问日志前缀排除功能,减少噪声日志。

该PR值得快速浏览,关注日志过滤器的实现细节(如`_UvicornAccessLogFilter`类中从`record.args`提取路径的方法),但无需深入分析,因变更较小且直白。

#21709 Fix draft extend cuda graph when spec_step=1

原始 PR · 作者 Qiaolin-Yu · 合并时间 2026-04-01 09:29

缺陷修复 重要性 4.00 洞察度 3.00

修复spec_step=1时CUDA图支持判断错误,确保草稿扩展使用正确后端。

该PR值得精读,展示了草稿扩展中后端选择与CUDA图支持的耦合关系。关注点:1. draft_attn_backend与draft_extend_attn_backend的职责分离;2. HIP代码块未修复的潜在问题;3. 后端类名重构的上下文。

基础设施 重要性 4.00 洞察度 3.00

添加测试网络超时和动态并行度配置以优化 CI 稳定性。

对于技术管理者和工程师,此 PR 值得关注以了解 CI 基础设施的优化模式,特别是超时设置和并行度配置;对于核心开发者,无需深究代码细节,但可借鉴类似维护实践。

缺陷修复 重要性 3.00 洞察度 2.00

修复gRPC服务器导入错误链,避免真实异常被屏蔽,提升调试体验。

该PR变更简单直接,适合快速review;对于理解Python异常链和错误处理最佳实践有参考价值,值得关注错误消息设计的清晰性。

参与讨论