Prhub

#22285 Add CI tests for GLM-5

原始 PR 作者 Fridge003 合并时间 2026-04-08 16:05 文件变更 2 提交数 10 评论 5 代码增减 +153 / -30

执行摘要

为 GLM-5 模型添加 CI 测试,扩展 8-GPU 测试套件。

PR标题明确指出“Add CI tests for GLM-5”,动机是扩展CI测试以覆盖GLM-5模型,确保该模型在多种配置下的正确性和性能。虽然PR body未提供具体描述,但从文件变更和同仓库历史PR(如#21710涉及GLM-5性能基准测试)推断,此举旨在加强模型测试矩阵。

建议工程师关注测试配置的合理性和阈值设置;PR值得略读以了解如何为大型模型添加CI测试,但无复杂设计决策需深入分析。

讨论亮点

无review评论,讨论为空。

实现拆解

实现分为两个关键文件:

1) 'test/registered/8-gpu-models/test_dsa_models_basic.py':重命名自'test_deepseek_v32_basic.py',添加了TestGLM5DP和TestGLM5TP类,分别测试8-GPU DP和TP配置,包括GSM8K准确性测试和单批次速度基准。
2) 'test/registered/8-gpu-models/test_dsa_models_mtp.py':重命名自'test_deepseek_v32_mtp.py',添加了TestGLM5DPMTP和TestGLM5TPMTP类,支持推测解码(EAGLE算法)测试。变更包括更新模型路径、调整超参数(如内存分数)和设置性能阈值。

文件 模块 状态 重要度
test/registered/8-gpu-models/test_dsa_models_basic.py test/8-gpu-models renamed 5.0
test/registered/8-gpu-models/test_dsa_models_mtp.py test/8-gpu-models renamed 5.0

关键符号

TestGLM5DP.test_a_gsm8k TestGLM5DP.test_bs_1_speed TestGLM5TP.test_a_gsm8k TestGLM5TP.test_bs_1_speed TestGLM5DPMTP.test_a_gsm8k TestGLM5DPMTP.test_bs_1_speed TestGLM5TPMTP.test_a_gsm8k TestGLM5TPMTP.test_bs_1_speed

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

风险主要包括:

1) 测试阈值设置可能不合理(如速度阈值40 token/s),导致CI误报或漏报;
2) 配置错误,如内存分数调整(--mem-frac 0.8)可能影响测试稳定性;
3) 新增测试可能增加CI运行时间(est_time从360增至720),影响资源消耗。

影响范围限于CI测试套件:

1) 正面影响:增强对GLM-5模型的测试覆盖,有助于早期检测回归;
2) 对用户无直接影响,但间接提升模型可靠性;
3) 对团队:需维护新增测试,并监控CI通过率。影响程度中等,因为变更仅涉及测试代码。

测试阈值风险 配置兼容性 CI 时间增加

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论