移除 req_time_stats 单元测试文件并重构两个测试文件的导入机制,避免 CPU-only 环境依赖问题。
建议技术管理者关注测试覆盖缺口,考虑在后续 PR 中恢复或替换被移除的测试。工程师应精读 test_request_metrics_exporter.py 的 stubbing 逻辑,评估其健壮性,并确保无条件 stub 以避免 flaky。
SGLang is a high-performance serving framework for large language models and multimodal models.
移除 req_time_stats 单元测试文件并重构两个测试文件的导入机制,避免 CPU-only 环境依赖问题。
建议技术管理者关注测试覆盖缺口,考虑在后续 PR 中恢复或替换被移除的测试。工程师应精读 test_request_metrics_exporter.py 的 stubbing 逻辑,评估其健壮性,并确保无条件 stub 以避免 flaky。
原始 PR · 作者 merrymercy · 合并时间 2026-04-06 11:20
缓存DeepSeekV2解码层中gfx95量化格式检测逻辑,避免每次前向传播重复计算。
该PR值得精读,尤其是关注量化格式检测的缓存设计决策。建议关注:1. 惰性初始化与缓存的实现方式,如何平衡初始化开销和运行时性能。2. 检测逻辑的健壮性,特别是权重可能为None的情况处理。3. 与近期PR#22134(修复DeepSeek-V2路由器GEMM)的关联,显示DeepSeek模型优化是当前重点。
修复Speculative Decoding V2中Eagle3模型崩溃的两个潜在bug。
建议精读,特别是logits_processor.py中的aux_pruned_states修复,展示了如何处理多隐藏状态切片和拼接的模式。关注条件检查(if aux_hidden_states is not None)和列表推导式的使用,这是处理可选参数的典型做法。
原始 PR · 作者 Lidang-Jiang · 合并时间 2026-04-06 10:30
为srt/utils/auth.py认证模块添加29个CPU-only单元测试。
建议团队阅读此PR以学习如何编写全面的单元测试,特别是认证逻辑的边界覆盖。对于新贡献者,可作为测试编写的最佳实践参考,但变更机械简单,无需深入解析代码逻辑。
原始 PR · 作者 Lidang-Jiang · 合并时间 2026-04-06 10:29
添加Hermes、Llama32、Mistral功能调用检测器的39个CPU-only单元测试。
建议工程师精读此PR,学习如何为不同格式的检测器设计全面测试用例,特别是流式增量解析的测试方法。关注review讨论中的改进点,如使用`CustomTestCase`和加强断言,这些是提升测试质量的关键决策。
为 tiktoken_tokenizer 模块添加单元测试,增强 tokenizer 组件可靠性。
建议工程师精读此 PR,以学习如何在 SGLang 项目中编写有效的单元测试,包括 mocking 技术、使用 `CustomTestCase`、和遵循 CI 集成模式。技术管理者可将其视为测试覆盖改进计划的一个成功案例。
修复扩散模型CI中LoRA用例的ground-truth生成路径不一致问题。
该PR变更聚焦且目标明确,适合快速了解扩散模型CI中LoRA测试路径的统一方法。值得关注的设计决策是:通过统一的LoRA用例检测函数隔离GT生成的后端强制逻辑,保持了非LoRA用例的现有行为。对于负责CI或扩散模型测试的工程师,建议精读`_is_lora_case`函数的实现和GT模式的条件判断逻辑。
原始 PR · 作者 xiezhq-hermann · 合并时间 2026-04-06 09:47
修复Hisparse JIT内核LRU策略中miss位置计算错误,确保缓存淘汰顺序正确。
该PR值得精读,特别是关注LRU写回逻辑的重构方式。虽然变更较小,但涉及核心缓存管理策略,建议: 1. 理解原实现错误的具体表现(为何需要移动LRU写回位置)。 2. 评估review中关于使用实际miss计数的建议是否应在后续优化中采纳。 3. 结合历史PR#22131(Hisparse Minor Fix)一起阅读,了解Hisparse模块的持续改进脉络。
参与讨论