Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-04-20 06:55 同步状态:空闲 下次计划:2026-04-20 07:55

PR 列表

已合并 966 · 已分析 966
更多筛选
2026-04-06

#22176 Fix ut module importing

原始 PR · 作者 ispobock · 合并时间 2026-04-06 11:53

测试 重要性 4.00 洞察度 5.00

移除 req_time_stats 单元测试文件并重构两个测试文件的导入机制,避免 CPU-only 环境依赖问题。

建议技术管理者关注测试覆盖缺口,考虑在后续 PR 中恢复或替换被移除的测试。工程师应精读 test_request_metrics_exporter.py 的 stubbing 逻辑,评估其健壮性,并确保无条件 stub 以避免 flaky。

性能优化 重要性 5.00 洞察度 4.00

缓存DeepSeekV2解码层中gfx95量化格式检测逻辑,避免每次前向传播重复计算。

该PR值得精读,尤其是关注量化格式检测的缓存设计决策。建议关注:1. 惰性初始化与缓存的实现方式,如何平衡初始化开销和运行时性能。2. 检测逻辑的健壮性,特别是权重可能为None的情况处理。3. 与近期PR#22134(修复DeepSeek-V2路由器GEMM)的关联,显示DeepSeek模型优化是当前重点。

#21589 [sgl] two potential spec_v2 bug fixes

原始 PR · 作者 bixue2010 · 合并时间 2026-04-06 10:41

缺陷修复 重要性 5.00 洞察度 4.00

修复Speculative Decoding V2中Eagle3模型崩溃的两个潜在bug。

建议精读,特别是logits_processor.py中的aux_pruned_states修复,展示了如何处理多隐藏状态切片和拼接的模式。关注条件检查(if aux_hidden_states is not None)和列表推导式的使用,这是处理可选参数的典型做法。

#21400 [CI] Add unit tests for srt/utils/auth.py

原始 PR · 作者 Lidang-Jiang · 合并时间 2026-04-06 10:30

测试 重要性 4.00 洞察度 4.00

为srt/utils/auth.py认证模块添加29个CPU-only单元测试。

建议团队阅读此PR以学习如何编写全面的单元测试,特别是认证逻辑的边界覆盖。对于新贡献者,可作为测试编写的最佳实践参考,但变更机械简单,无需深入解析代码逻辑。

测试 重要性 4.00 洞察度 5.00

添加Hermes、Llama32、Mistral功能调用检测器的39个CPU-only单元测试。

建议工程师精读此PR,学习如何为不同格式的检测器设计全面测试用例,特别是流式增量解析的测试方法。关注review讨论中的改进点,如使用`CustomTestCase`和加强断言,这些是提升测试质量的关键决策。

测试 重要性 4.00 洞察度 4.00

为 tiktoken_tokenizer 模块添加单元测试,增强 tokenizer 组件可靠性。

建议工程师精读此 PR,以学习如何在 SGLang 项目中编写有效的单元测试,包括 mocking 技术、使用 `CustomTestCase`、和遵循 CI 集成模式。技术管理者可将其视为测试覆盖改进计划的一个成功案例。

#22157 [CI] No diffusers backend in lora case

原始 PR · 作者 Prozac614 · 合并时间 2026-04-06 10:14

基础设施 重要性 4.00 洞察度 3.00

修复扩散模型CI中LoRA用例的ground-truth生成路径不一致问题。

该PR变更聚焦且目标明确,适合快速了解扩散模型CI中LoRA测试路径的统一方法。值得关注的设计决策是:通过统一的LoRA用例检测函数隔离GT生成的后端强制逻辑,保持了非LoRA用例的现有行为。对于负责CI或扩散模型测试的工程师,建议精读`_is_lora_case`函数的实现和GT模式的条件判断逻辑。

#22170 fix hisparse LRU policy

原始 PR · 作者 xiezhq-hermann · 合并时间 2026-04-06 09:47

缺陷修复 重要性 5.00 洞察度 4.00

修复Hisparse JIT内核LRU策略中miss位置计算错误,确保缓存淘汰顺序正确。

该PR值得精读,特别是关注LRU写回逻辑的重构方式。虽然变更较小,但涉及核心缓存管理策略,建议: 1. 理解原实现错误的具体表现(为何需要移动LRU写回位置)。 2. 评估review中关于使用实际miss计数的建议是否应在后续优化中采纳。 3. 结合历史PR#22131(Hisparse Minor Fix)一起阅读,了解Hisparse模块的持续改进脉络。

参与讨论