#38381 [ROCm][CI] Pin test_hybrid test to TRITON_ATTN on ROCm

原始 PR 作者 micah-wil 合并时间 2026-03-31 04:26 文件变更 1 提交数 2 评论 2 代码增减 +11 / -2

执行摘要

在 ROCm 平台上固定 test_hybrid 测试使用 TRITON_ATTN 后端以减少 flakiness。

根据 PR body，在 PR #36702 重新排序注意力后端优先级后，test_hybrid.py 出现 flakiness（示例构建链接）。目的是通过固定后端来减少 ROCm 上的测试不稳定。

这是一个简单的测试修复，值得快速阅读以了解如何处理平台特定测试 flakiness；关注条件变量的定义和使用模式，以及作者基于观察的决策。

讨论亮点

review 中，gemini-code-assist[bot] 建议将 ATTN_BACKEND 应用到文件中的所有相关测试以完全解决 flakiness。作者 micah-wil 回应称，由于未观察到其他测试的问题，因此无需更改，最终决定只修改部分测试。

实现拆解

实现集中于文件 tests/models/language/generation/test_hybrid.py：新增全局变量 ATTN_BACKEND = 'TRITON_ATTN' if current_platform.is_rocm() else 'auto'；然后，在多个测试函数中（如 test_models、test_chunked_prefill_with_parallel_sampling 等），将 attention_backend=ATTN_BACKEND 参数添加到 vllm_runner 调用中。

文件	模块	状态	重要度
`tests/models/language/generation/test_hybrid.py`	测试模块	modified	5.0

关键符号

ATTN_BACKEND test_models test_chunked_prefill_with_parallel_sampling test_full_cuda_graph _get_vllm_runner_params test_apc_common_prefix_same_batch

分析完成后，这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

测试覆盖率 测试

gemini-code-assist[bot] 建议将 ATTN_BACKEND 应用到所有相关测试以完全解决 flakiness，但作者 micah-wil 认为未观察到问题的测试无需更改。

结论：仅修改部分测试，作者基于观察决定。 · 已解决

风险与影响

风险较低：变更仅影响测试代码，不涉及生产逻辑；潜在风险是未覆盖所有测试（如 test_batching 等），可能导致某些测试仍不稳定，但作者评估那些测试无问题，风险可控。

影响仅限于 ROCm 平台的 CI 测试环境，提高测试稳定性和可靠性；对用户、系统和团队无直接影响。

部分测试未修改

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接，后续同步到相关引用后会出现在这里。

完整报告

PR #38381 分析报告

执行摘要

此 PR 通过将 ROCm 平台上的 test_hybrid 测试固定使用 TRITON_ATTN 注意力后端，解决了因后端优先级重新排序导致的测试不稳定问题，仅影响 CI 测试环境，属于常规维护性修复。

功能与动机

在 PR #36702 重新排序注意力后端优先级后，ROCm 平台的 test_hybrid.py 测试出现 flakiness（如构建失败示例）。此变更旨在通过指定后端来减少批量差异效应，提高测试可靠性，避免 CI 环境中的随机失败。

实现拆解

文件: tests/models/language/generation/test_hybrid.py
关键变更:
- 新增条件变量: ATTN_BACKEND = "TRITON_ATTN" if current_platform.is_rocm() else "auto"
- 应用到以下测试函数的 vllm_runner 调用中（添加 attention_backend=ATTN_BACKEND 参数）:
  - test_models
  - test_chunked_prefill_with_parallel_sampling
  - test_full_cuda_graph
  - _get_vllm_runner_params
  - test_apc_common_prefix_same_batch

评论区精华

review 中，gemini-code-assist[bot] 指出：

"To fully address the flakiness on ROCm as described in the pull request, this ATTN_BACKEND should be applied to all relevant tests in this file."

作者 micah-wil 回应：

"Good point, but since we haven't observed issues in those tests, I don't think we have any reason to change them."

讨论焦点是测试覆盖率，最终决策基于实际观察，未扩展修改范围。

风险与影响

风险: 变更局限于测试代码，风险低；但未覆盖所有可能相关测试（如 test_batching），可能残留不稳定风险，不过作者评估可控。
影响: 仅提升 ROCm CI 测试的稳定性，对用户或系统无直接影响。

关联脉络

此 PR 是对历史 PR #36702（注意力后端优先级重新排序）的直接修复，属于 ROCm 平台测试优化的一部分。从近期历史 PR 看，vLLM 仓库在 ROCm 和测试方面有持续改进（如 #37698、#37529），反映了对跨平台稳定性的重视。

#38381 [ROCm][CI] Pin test_hybrid test to TRITON_ATTN on ROCm

执行摘要

在 ROCm 平台上固定 test_hybrid 测试使用 TRITON_ATTN 后端以减少 flakiness。

实现拆解

评论区精华

风险与影响

关联 Issue

未识别关联 Issue

完整报告

参与讨论