修复 retry() 未传播 _ShouldStop 导致 CI 误报
建议精读。此 PR 虽小,但揭示了 unittest 内部 `_ShouldStop` 信号与重试装饰器交互的微妙问题,对理解 Python 测试框架和 CI 失败调试有参考价值。代码注释清晰,是良好的异常处理实践案例。
SGLang is a high-performance serving framework for large language models and multimodal models.
修复 retry() 未传播 _ShouldStop 导致 CI 误报
建议精读。此 PR 虽小,但揭示了 unittest 内部 `_ShouldStop` 信号与重试装饰器交互的微妙问题,对理解 Python 测试框架和 CI 失败调试有参考价值。代码注释清晰,是良好的异常处理实践案例。
清理模型 E2E 测试目录结构
值得精读,展示了如何系统性地组织大型测试套件,包括目录约定、server 启动拆分和公共 mixin 提取。对维护大规模测试套件的团队有参考价值。
清理 DeepSeek V4 测试和安装脚本
对于关注 CI 基础设施组织的读者值得精读,展示了如何通过删除冗余和统一命名来降低维护成本。
为 GSP 数据集增加 Zipf 前缀分布采样
该 PR 设计干净,值得阅读:1)`_zipf_group_probs` 数学实现简洁;2)CLI 校验前移,减少用户等待;3)RNG 隔离保证可复现性;4)缓存键细分,避免不同分布互相污染;5)测试覆盖全面,包括数学验证和子进程 CLI 测试。
为 bench_serving 添加 SPEED-Bench 数据集支持,用于推测解码基准测试
值得关注。该 PR 展示了如何通过标准的 BaseDataset 接口扩展 bench_serving 的数据集类型,是一种良好的插件式设计。对于计划集成其他标准化基准(如 MMLU、HumanEval)的开发者具有参考价值。review 中的优化建议和采纳过程也体现了代码质量意识。
恢复误删的 Qwen3-30B CP 测试
该 PR 是简单的测试恢复操作,不值得深入阅读。但可以作为恢复误删文件的标准操作范例:确认原始内容、直接还原、并在 PR body 说明原因。
支持 Kimi-K2.6 EAGLE3.1-MLA 草稿模型
值得精读,尤其是对 speculative decoding 和模型加载兼容性设计感兴趣的人。两个配置标志的默认值设计和遗留标志兼容做法值得学习。
原始 PR · 作者 alphabetc1 · 合并时间 2026-05-29 04:33
修复adaptive spec初始化使用错误draft token数
建议所有维护speculative decoding模块的开发者阅读此PR,了解如何正确使用'cached_property'和统一最大draft token数的获取方式。改动虽小但修复了隐蔽的bug,值得认可。
参与讨论