Prhub

#24754 Reduce gemma4 moe deterministic test runtime

原始 PR 作者 kpham-sgl 合并时间 2026-05-09 11:46 文件变更 1 提交数 2 评论 1 代码增减 +2 / -6

执行摘要

缩短 gemma4 MoE 确定性测试运行时间

减少回归测试在 CI 中的运行时间,从 420 秒缩短到 107 秒,以加速 CI 流水线。

建议合并。该 PR 在保持测试有效性的前提下显著缩短了 CI 时间,属于高效的运维改进。

讨论亮点

该 PR 没有 review 评论或讨论。

实现拆解

  1. 在文件 test/registered/core/test_gemma4_moe_deterministic.py 中,将 register_cuda_ciest_time 参数从 420 改为 107。
  2. NUM_REQUESTS 从 200 减少为 180。
  3. 删除了 docstring 中描述原始 bug 复现行为和修复效果的 3 行内容。
文件 模块 状态 重要度
test/registered/core/test_gemma4_moe_deterministic.py 测试 modified 4.01

关键源码片段

test/registered/core/test_gemma4_moe_deterministic.py test-coverage

唯一变更文件:调整了期望运行时间和请求数量,并精简了文档字符串。

# gemma4/moe/deterministic: 回归测试配置调整
# 变更前 : est_time=420, NUM_REQUESTS=200
# 变更后 : est_time=107, NUM_REQUESTS=180register_cuda_ci(est_time=107, suite="stage-b-test-2-gpu-large")
# ...
NUM_REQUESTS = 180
CONCURRENCY = 128
MAX_TOKENS = 256

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

风险极低:仅调整测试参数和文档,未修改任何核心逻辑。减少请求数可能略微降低测试覆盖率,但 180 个请求仍足以触发并验证原 issue #24394 中的 OOB 问题。

影响范围仅限于单个测试文件。该 PR 使 CI 中 Gemma4 MoE 确定性测试的运行时间缩短约 75%,加快 CI 反馈速度。

测试微调不影响核心逻辑

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论