Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-04-20 05:54 同步状态:空闲 下次计划:2026-04-20 06:54

PR 列表

已合并 966 · 已分析 966
更多筛选
2026-04-07
重构 重要性 5.00 洞察度 6.00

清理请求时间统计模块,减少开销并简化代码,优化性能与可读性。

建议工程师精读此PR,关注时间戳默认逻辑的设计权衡和tracing_enable检查的性能优化技巧;同时,在类似代码中避免使用`or`操作符处理可能为0.0的默认值,并检查重命名一致性。

#22207 [misc] update CI_PERMISSIONS.json

原始 PR · 作者 Qiaolin-Yu · 合并时间 2026-04-07 05:11

基础设施 重要性 2.00 洞察度 1.00

为zhendonghua用户添加CI权限配置,允许其触发CI测试和重试。

这是一个简单的权限管理变更,无需深入技术分析。建议权限管理员确认zhendonghua用户的身份和权限需求即可。对于普通工程师,无需特别关注此PR的技术细节。

重构 重要性 2.00 洞察度 1.00

修复多层级Eagle推测解码中链式MTP注释的变量引用错误。

该PR无需精读,除非您正在深入理解多层级Eagle推测解码的链式MTP实现细节。变更简单,可作为代码文档维护的良好示例。

#22041 [sgl] potential chained spec v2 fixes

原始 PR · 作者 2022tgoel · 合并时间 2026-04-07 04:38

缺陷修复 重要性 5.00 洞察度 4.00

修复链式MTP推测解码中隐藏状态更新错误,确保草案生成正确性。

该PR值得精读,特别是对于从事推测解码开发的工程师。关注点:1. 链式MTP中隐藏状态传递的设计模式。2. CUDA图运行器中buffers与self状态管理的区别。3. 条件逻辑如何确保状态更新仅在需要时发生。

缺陷修复 重要性 6.00 洞察度 4.00

修复 Qwen3.5 多模态模型在编码器分离中的验证错误,允许 EPD 部署。

该 PR 值得精读,特别是 server_args.py 中的验证逻辑和测试设计,以了解编码器分离的架构支持和多模态模型集成模式。

#22194 [Qwen3-Specv2]: Fix flaky ci

原始 PR · 作者 hzh0425 · 合并时间 2026-04-07 00:40

测试 重要性 2.00 洞察度 1.00

提高Qwen3 Next MTP V2测试的KL散度阈值以修复CI不稳定性。

此PR无需精读,除非您负责Qwen3 Next MTP测试维护。关注点:阈值调整是否合理(从0.0025到0.0035的增量是否基于数据驱动决策)。

2026-04-06

#22190 Update test coverage report

原始 PR · 作者 ispobock · 合并时间 2026-04-06 20:59

基础设施 重要性 2.00 洞察度 2.00

优化CI覆盖率报告格式,按未覆盖行数排序低覆盖率模块并改用Markdown表格展示。

该PR变更简单,无需深入精读。建议关注其作为CI基础设施改进的示例,展示了如何优化自动化报告以提升开发效率。

#22189 Update test skills and guide

原始 PR · 作者 ispobock · 合并时间 2026-04-06 20:30

文档 重要性 3.00 洞察度 5.00

更新测试编写指南,禁止模块级sys.modules修改以避免跨测试污染。

该PR值得测试开发者和维护者精读,因为它明确了测试依赖模拟的最佳实践。重点关注: 1. 为什么模块级sys.modules修改会导致跨测试污染。 2. patch.dict作为类装饰器的正确使用方法。 3. 现有maybe_stub_sgl_kernel()模式与新指南的关系(这是一个未明确解答的问题)。

参与讨论