Prhub

#37691 [cpu][ci] remove soft-fail for Arm CI and add quant model tests

原始 PR 作者 fadara01 合并时间 2026-03-26 15:03 文件变更 2 提交数 1 评论 7 代码增减 +8 / -2

执行摘要

移除 Arm CI 的软失败标志并添加量化模型测试。

根据 PR 正文,Arm CI 管道已经运行了几个月(在 30 分钟内完成)且无故障,只在 vLLM 有真正 bug 时才失败,因此是时候移除软失败。此外,添加 w8a8 量化模型测试以扩展测试覆盖。

该 PR 值得快速浏览,以了解 CI 配置的变更和 Arm CPU 量化测试的添加。关注点在于测试覆盖的权衡决策,以及如何针对不同后端定制测试。

讨论亮点

在 review 中,gemini-code-assist[bot] 指出 PR 描述中提及添加‘量化模型测试’(复数),但只运行单个测试函数,建议运行整个 tests/quantization/test_compressed_tensors.py 文件以确保覆盖。作者 fadara01 回应说其他测试不适用于 CPU 后端,当前实现正确。最终决策是保持原有测试命令,因为它针对 CPU 后端定制。

实现拆解

实现分为两部分:一是在 .buildkite/hardware_tests/cpu.yaml 中将 Arm CPU Test 步骤的 soft_fail 设置为 false,使其成为硬性要求。二是在 .buildkite/scripts/hardware_ci/run-cpu-test-arm.sh 中,将核心范围从 0-16 扩展到 0-31,并添加一个针对 CPU 后端的 w8a8 量化模型的 pytest 测试命令。

文件 模块 状态 重要度
.buildkite/hardware_tests/cpu.yaml CI modified 4.0
.buildkite/scripts/hardware_ci/run-cpu-test-arm.sh Testing modified 5.0

关键符号

cpu_tests

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

量化测试覆盖的充分性 测试

gemini-code-assist[bot] 建议运行整个 tests/quantization/test_compressed_tensors.py 文件以增加覆盖,但作者 fadara01 回应其他测试不适用于 CPU 后端。

结论:保持仅运行单个测试函数 test_compressed_tensors_w8a8_logprobs,因为它是针对 CPU 后端定制的。 · 已解决

风险与影响

主要风险包括:

  1. 移除 soft-fail 后,Arm CI 失败将直接阻止合并,如果测试不稳定可能导致误判,但鉴于管道历史稳定,风险较低。
  2. 添加的量化测试仅覆盖 w8a8 压缩张量,可能遗漏其他量化格式或场景的回归测试。

对 CI 流程的影响:Arm CPU 测试现在成为硬性要求,提高代码质量门槛,但可能增加合并复杂度。对测试覆盖的影响:增强了 Arm CPU 上的量化模型验证,特别是 w8a8 格式,但测试范围有限,可能未充分覆盖所有量化相关代码路径。

测试覆盖不足 CI 依赖变更

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论