Prhub

#24713 [HiCache] ci: lower est_time for test_hicache_spec_file_storage

原始 PR 作者 alphabetc1 合并时间 2026-05-09 15:33 文件变更 1 提交数 1 评论 1 代码增减 +1 / -1

执行摘要

降低 HiCache 测试预估时间以平衡 CI 分区

PR body 指出 test_hicache_spec_file_storage 注册的 est_time=600s 远超实际运行时间(~240s),导致 LPT 分区器将该测试单独分配一个分区,而其他分区过载,延长了阶段关键路径。

可快速合入,无需深入精读。但值得关注 run_suite.py 分区器如何利用 est_time,可为其他测试的类似优化提供参考。

讨论亮点

无 review 讨论。审核者 Kangyan-Zhou 直接批准。

实现拆解

  1. test/registered/hicache/test_hicache_spec_file_storage.py 中将 register_cuda_ci(est_time=600, ...) 改为 register_cuda_ci(est_time=200, ...)
  2. 该值仅影响分区规划,不涉及超时或门控逻辑,无其他行为变更。
文件 模块 状态 重要度
test/registered/hicache/test_hicache_spec_file_storage.py 测试 modified 2.85

关键源码片段

test/registered/hicache/test_hicache_spec_file_storage.py test-coverage

唯一变更文件,修改了 `register_cuda_ci` 的预估时间参数。

# 在文件顶部,注册 CI 测试并设置预估时间(单位:秒)
# 基于实际观察到的约 240s 墙钟时间,将过高的 600s 降至 200s
# 以改善 LPT 分区器的负载均衡
register_cuda_ci(est_time=200, suite="stage-b-test-1-gpu-large")@unittest.skipIf(is_hip(), "HiCache + EAGLE3 file-storage loadback e2e is CUDA-only.")
class TestHiCacheSpecFileStorage(CustomTestCase):
    model = DEFAULT_TARGET_MODEL_EAGLE3
    draft_model = DEFAULT_DRAFT_MODEL_EAGLE3
    # ... 其余代码不变

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

风险极低:仅修改一个元数据字段,不影响测试逻辑或系统行为。若实际运行时间再次变化,可能导致分区不平衡,但可通过再次调整缓解。

影响局限于 CI 阶段 stage-b-test-1-gpu-large 内该测试所在的分区负载,预期减少分区空闲时间,提升整体 CI 效率。

极低风险

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论