#22571 Remove redundant test_page_size.py
作者 hnyls2002 · 合并时间 2026-04-11 11:35
删除冗余的页面大小测试文件,其功能已被更全面的EAGLE测试覆盖。
该PR变更简单,无需深入精读。对于团队来说,值得关注的是测试覆盖的优化策略,即识别并删除冗余测试以提升CI效率。建议在类似清理操作中确保有明确的覆盖验证(如PR body中的测试计划),以避免意外丢失测试场景。
SGLang is a high-performance serving framework for large language models and multimodal models.
作者 hnyls2002 · 合并时间 2026-04-11 11:35
删除冗余的页面大小测试文件,其功能已被更全面的EAGLE测试覆盖。
该PR变更简单,无需深入精读。对于团队来说,值得关注的是测试覆盖的优化策略,即识别并删除冗余测试以提升CI效率。建议在类似清理操作中确保有明确的覆盖验证(如PR body中的测试计划),以避免意外丢失测试场景。
作者 yhyang201 · 合并时间 2026-04-11 11:13
启用GPU图像预处理,显著降低Kimi-K2.5模型的首次令牌生成时间。
建议工程师精读kimi_k25.py中的GPU处理函数(如navit_resize_config和_process_single_image),学习图像预处理的GPU加速设计;关注review中讨论的冗余检查和内存管理问题,以改进代码质量。
作者 happierpig · 合并时间 2026-04-11 10:27
修复CUDA Graph捕获时num_token_non_padded计算逻辑,确保捕获与重放行为一致。
建议CUDA Graph和attention TP相关开发者精读此PR,理解捕获与重放路径对齐的设计决策。关注条件判断逻辑和compute_local_num_token_non_padded函数的实现,确保在不同配置下行为正确。
作者 mickqian · 合并时间 2026-04-11 10:08
改进扩散模型CI测试可读性并修复早期返回bug。
建议技术管理者和工程师精读run_suite.py的重试机制设计,理解如何平衡测试稳定性和准确性,并关注对早期返回bug的修复以避免类似问题。同时,review讨论中的OOM检测改进值得后续跟踪。
作者 Qiaolin-Yu · 合并时间 2026-04-11 09:58
为用户lawrence-harmonic添加CI权限配置,允许其触发CI测试和重试失败任务。
该PR变更简单直接,无需深入阅读。对于了解CI权限管理机制的工程师,可快速浏览以熟悉配置格式;对于其他人员,可忽略。
作者 bingxche · 合并时间 2026-04-11 09:40
升级AMD平台Aiter依赖至v0.1.12.post1并移除硬编码安装
该PR变更直接,建议快速浏览以了解AMD平台依赖管理更新。值得关注的设计决策是移除硬编码依赖转向标准requirements.txt管理,这体现了依赖管理的规范化趋势。对于使用AMD平台的开发者,需要确认新版本Aiter的稳定性。
作者 sglang-bot · 合并时间 2026-04-11 09:15
自动化更新250个CI测试文件的估计时间值,优化负载均衡算法准确性。
该PR无需精读,除非您负责CI基础设施、测试调度优化或关注自动化流程。可快速浏览以了解est_time更新机制,但无重要设计决策需深入分析。
作者 ch-wan · 合并时间 2026-04-11 08:54
修复CI测试时间估算脚本,按后端硬件区分时间统计,避免跨后端数据污染。
该PR虽小但展示了CI基础设施中一个重要的数据隔离问题。建议精读以理解:1) 如何通过数据结构设计避免数据污染;2) 正则表达式在配置更新中的精确匹配技巧。对于负责CI维护的工程师,这是值得参考的修复模式。
参与讨论