#22565 chore: update CI test est_time values
原始 PR · 作者 sglang-bot · 合并时间 2026-04-11 09:15
自动化更新250个CI测试文件的估计时间值,优化负载均衡算法准确性。
该PR无需精读,除非您负责CI基础设施、测试调度优化或关注自动化流程。可快速浏览以了解est_time更新机制,但无重要设计决策需深入分析。
SGLang is a high-performance serving framework for large language models and multimodal models.
原始 PR · 作者 sglang-bot · 合并时间 2026-04-11 09:15
自动化更新250个CI测试文件的估计时间值,优化负载均衡算法准确性。
该PR无需精读,除非您负责CI基础设施、测试调度优化或关注自动化流程。可快速浏览以了解est_time更新机制,但无重要设计决策需深入分析。
修复CI测试时间估算脚本,按后端硬件区分时间统计,避免跨后端数据污染。
该PR虽小但展示了CI基础设施中一个重要的数据隔离问题。建议精读以理解:1) 如何通过数据结构设计避免数据污染;2) 正则表达式在配置更新中的精确匹配技巧。对于负责CI维护的工程师,这是值得参考的修复模式。
原始 PR · 作者 alisonshao · 合并时间 2026-04-11 08:49
修复因#22365引入的扩散模型单元测试失败,通过Mock下载函数避免本地路径被误识别为HF仓库。
该PR变更简单,无需精读。对于关注扩散模型量化加载逻辑或CI测试稳定性的工程师,可快速浏览以了解Mock用法和测试修复模式。
修复CI测试时间估算脚本,按测试套件而非后端硬件区分时间统计。
该PR值得CI/基础设施维护者精读,展示了如何从CI日志中提取和关联元数据以优化资源调度。关注点:1. job_name_to_suite函数的设计如何平衡灵活性与鲁棒性。2. 从backend到suite的键变更如何影响时间数据聚合粒度。
修复空闲路径下token_usage统计缺失Mamba使用量的问题,并添加字段命名澄清注释。
该PR值得快速浏览,重点关注:1) 修复逻辑如何确保混合SSM场景下统计一致性。2) FIXME注释揭示的字段命名技术债务,可作为未来API设计参考。对于深入理解内存管理或Mamba集成的工程师有参考价值。
为非流式请求引入文本缓冲机制,避免O(N²)字符串拼接并修复相关逻辑。
建议技术管理者和核心工程师精读此 PR,重点关注: 1. `ReqState` 中 buffer_text 的设计决策,这是避免 O(N²) 拼接的关键。 2. Review 中关于 `stream_output` 与 `incremental_streaming_output` 区别的讨论,有助于理解 SGLang 流式输出配置的设计哲学。 3. 性能优化技巧,如 kwargs 比较优化和 batch_decode 的 zip 合并。 4. 留意作者提到的 `stream-output+stream` 性能回归问题,可能需后续跟踪。
新增GB200集群夜间性能回归测试管道,监控DeepSeek-R1推理基准。
该PR主要涉及CI基础设施,值得团队负责CI的工程师精读,以学习Slurm集成和自动化测试设计。对于核心开发人员,关注配置管理和结果处理部分,但变更对核心代码无直接影响。
添加每周工作流自动化更新CI测试估计时间,优化负载均衡。
该PR值得精读,特别是脚本中的日志解析、中位数计算和正则表达式更新逻辑,这些设计决策展示了CI自动化的最佳实践;建议关注GitHub API集成和错误处理部分,以了解如何稳健处理外部数据源。
参与讨论