Prhub

#22565 chore: update CI test est_time values

原始 PR 作者 sglang-bot 合并时间 2026-04-11 09:15 文件变更 250 提交数 3 评论 1 代码增减 +251 / -251

执行摘要

自动化更新 250 个 CI 测试文件的估计时间值,优化负载均衡算法准确性。

根据PR body描述,更新是为了'keep the LPT load-balancing algorithm accurate for partitioning tests across parallel CI jobs',基于main分支上scheduled PR Test runs的最近10次成功执行的中位数,以优化CI测试的负载均衡。

该PR无需精读,除非您负责CI基础设施、测试调度优化或关注自动化流程。可快速浏览以了解est_time更新机制,但无重要设计决策需深入分析。

讨论亮点

review评论为空,表明变更直接合并,没有争议或讨论。提交历史中有一个修复脚本的提交(修复后端匹配问题),但未在PR讨论中体现。

实现拆解

实现方案是修改测试文件中register_cuda_ciregister_cpu_ci调用的est_time参数值。所有变更都是数值更新,例如在test/registered/4-gpu-models/test_gpt_oss_4gpu.py中,est_time从300调整为328和312。共修改250个文件,每个文件改动一到两个数值,分布在不同测试套件和硬件后端(如H100、B200、H200)。

文件 模块 状态 重要度
test/registered/4-gpu-models/test_gpt_oss_4gpu.py 4-gpu-models modified 3.0
test/registered/8-gpu-models/test_deepseek_v3_basic.py 8-gpu-models modified 3.0
test/registered/attention/test_fa3.py attention modified 3.0

关键符号

register_cuda_ci register_cpu_ci

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

技术风险较低,因为只更新数值参数,不涉及代码逻辑变更。但若更新后的est_time不准确(例如基于历史数据的中位数可能无法反映最新性能变化),可能导致CI调度不均衡,影响测试执行时间或资源分配。由于变更范围广(250个文件),需确保自动化脚本的准确性,避免手动错误。

对最终用户无直接影响,但改进CI测试的负载均衡后,可提升团队开发效率,减少测试超时或资源浪费。系统层面,CI作业分配更准确,可能加快整体测试流水线。影响范围限于CI基础设施,程度中等,不涉及核心推理或模型功能。

数值更新可能不准确 影响 CI 调度

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论