Prhub

#42954 [XPU][CI] Temporarily skip test_moe_lora_align_block_size_mixed_base_and_lora[1] in Intel GPU CI

原始 PR 作者 zxd1997066 合并时间 2026-05-18 20:34 文件变更 1 提交数 1 评论 1 代码增减 +1 / -1

执行摘要

暂时跳过 Intel GPU CI 中一个不稳定的 MoE LoRA 测试

Intel GPU CI 中的一个 MoE LoRA 测试用例 test_moe_lora_align_block_size_mixed_base_and_lora[1] 存在不稳定因素,导致 CI 失败。为了不阻塞其他变更的合并,暂时跳过该测试,待后续修复后再恢复。

这是一次临时性的、低风险的 CI 稳定性应急措施,不建议精读。但应提醒团队在后续尽快修复被跳过的测试用例,并恢复执行。

讨论亮点

无实质讨论。只有自动机器人和审批人 jikunshang 的评论,审批人已批准。

实现拆解

  1. 修改 .buildkite/intel_jobs/lora_intel.yaml 文件,在第 52 行的 pytest 命令中添加 --deselect 选项,排除指定测试用例。
  2. 该文件是 Intel GPU CI 的 Buildkite 配置,位于 .buildkite/intel_jobs/ 模块,属于配置类变更。
文件 模块 状态 重要度
.buildkite/intel_jobs/lora_intel.yaml CI 配置 modified 2.5

关键源码片段

.buildkite/intel_jobs/lora_intel.yaml configuration

这是本次 PR 唯一变更的文件,通过添加 `--deselect` 参数跳过不稳定的测试用例,直接影响 Intel GPU CI 中 LoRA MoE 测试的执行行为。

# .buildkite/intel_jobs/lora_intel.yaml (LoRA Fused/MoE Kernels job)
    commands:
      - >-
        bash .buildkite/scripts/hardware_ci/run-intel-test.sh
        'cd tests &&
        export VLLM_WORKER_MULTIPROC_METHOD=spawn &&
        pytest -v -s lora/test_fused_moe_lora_kernel.py &&
        # 跳过不稳定的测试用例,防止 CI 阻塞,后续需修复后恢复
        pytest -v -s lora/test_moe_lora_align_sum.py --deselect="tests/lora/test_moe_lora_align_sum.py::test_moe_lora_align_block_size_mixed_base_and_lora[1]"'

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

风险极低:仅临时跳过一个测试用例,不影响任何生产代码。但需要关注该测试用例的根本原因,并在后续 PR 中修复后恢复。

仅影响 Intel GPU CI 管道:该测试用例不再执行,其他测试不受影响,CI 稳定性得到提升。

临时跳过测试可能掩盖根本问题

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论