Prhub

#24551 ci: bump test_mimo_models.py est_time 330 → 610

原始 PR 作者 alisonshao 合并时间 2026-05-07 05:35 文件变更 1 提交数 1 评论 1 代码增减 +1 / -1

执行摘要

上调 MiMo 测试预计时长避免超时

PR #23811 新增了第二个测试类(TestMiMoV2,模型 XiaomiMiMo/MiMo-V2.5,TP=8 DP=2,运行 MMMU + GSM8K + EAGLE 推测解码),但未同步上调 est_time。该文件现在需要运行约 500-640 秒,而 est_time 仍为 330 秒,导致自动分区器持续使 stage-c-test-8-gpu-h200 的 shard 0 过载,频繁触发 30 分钟的 Run test 超时上限(例如运行 ID 25428444359、25411981650)。

该 PR 是必要的 CI 配置修复,可快速合并。建议合并后观察至少一轮 CI 运行,确认超时问题是否解决。若仍偶发超时,可考虑进一步上调或分包(将两个测试类拆分到不同 est_time 条目)。

讨论亮点

该 PR 无实质性 review 讨论(Kangyan-Zhou 直接批准,无评论)。从 PR body 和 commit message 可知,超时问题是明确的机器负载不均导致,解决方案为直接上调 est_time 参数。

实现拆解

  1. 修改 test/registered/8-gpu-models/test_mimo_models.py 第 9 行:将 register_cuda_ci(est_time=330, suite="stage-c-test-8-gpu-h200") 中的 est_time 从 330 上调至 610。
  2. 该调整不涉及任何逻辑代码变更,仅更新测试预估时间元数据,使 CI 自动分区器能正确分配 shard,避免超时。
文件 模块 状态 重要度
test/registered/8-gpu-models/test_mimo_models.py 测试 modified 3.46

关键源码片段

test/registered/8-gpu-models/test_mimo_models.py test-coverage

上调 est_time 参数,从 330 调整至 610,以匹配 PR #23811 新增测试类后的实际运行时长,避免 CI 分区超时。

# test/registered/8-gpu-models/test_mimo_models.pyfrom sglang.test.ci.ci_register import register_cuda_ci# 关键变更:将 est_time 从 330 上调至 610,以匹配实际运行时长
register_cuda_ci(est_time=610, suite="stage-c-test-8-gpu-h200")class TestMiMoV2Flash(GSM8KMixin, SpecDecodingMixin, DefaultServerBase):
    # ... 测试类定义不变

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

风险极低。仅修改测试注册的预估时间元数据,不影响任何功能逻辑。若新估时仍低于实际运行时间(例如因环境差异导致运行时间超过 610 秒),则超时问题可能复现。建议在合并后观察 CI 运行情况,必要时再次上调。

  • CI 稳定性:直接影响 stage-c-test-8-gpu-h200 分区的测试成功率,从频繁超时转为预期正常。
  • 无用户/系统侧影响:仅涉及测试基础设施配置,不改变运行时行为、性能或 API。
CI 配置调整 无代码逻辑变更

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论