Prhub

#22297 Revert "[CI] Update nightly test models for H200/B200 (#22288)"

原始 PR 作者 Kangyan-Zhou 合并时间 2026-04-08 08:04 文件变更 5 提交数 1 评论 1 代码增减 +67 / -13

执行摘要

撤销 H200/B200 夜间测试模型更新,恢复至先前配置。

PR body 未提供具体动机,但根据上下文推断,可能是由于 PR #22288 更新夜间测试模型后导致 CI 问题或需要临时回退。关联 Issue 为空,评论中只有机器人提示,无人类讨论表明具体原因。

该 PR 是一个简单的 revert 操作,建议快速审查以确保没有意外副作用,无需深入技术分析。但应关注是否后续有替代 PR 来解决原始问题,并监控 CI 稳定性。

讨论亮点

没有 review 评论或讨论,变更直接由作者合并,表明这是一个紧急或简单的回退操作。

实现拆解

本 PR 通过一个 commit 撤销了 commit e6652309(对应 PR #22288)。关键变更包括:删除 PR #22288 添加的 test/registered/8-gpu-models/test_glm_46.py 文件;修改其他四个测试文件(如 test_deepseek_v31.pytest_qwen35.py),移除 register_cuda_ci 调用和相关配置更改,使测试恢复为手动模式或旧有配置。例如,在 test_qwen35.py 中移除了 DP 相关参数,只保留 MTP 配置。

文件 模块 状态 重要度
test/registered/8-gpu-models/test_glm_46.py testing removed 5.0
test/registered/8-gpu-models/test_qwen35.py testing modified 4.0
test/registered/8-gpu-models/test_deepseek_v31.py testing modified 3.0

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

撤销变更可能重新引入 PR #22288 试图解决的问题,具体风险包括:测试套件缺少对 GLM-4.6 模型的支持,可能导致新功能验证延迟;Qwen3.5 测试配置恢复为非 FP8 权重,可能影响性能基准的准确性;CI 测试效率可能降低,因为部分测试恢复为手动模式,减少自动化覆盖。

直接影响 CI 测试基础设施,夜间测试将使用旧的模型集,对 H200/B200 平台的测试覆盖有负面影响。对终端用户无直接影响,但可能间接影响开发团队对新模型兼容性和性能的验证速度。

测试覆盖减少 配置回退

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论