# PR #39509 完整报告

- 仓库：`vllm-project/vllm`
- 标题：[ROCm] [AITER] Revert AITER version to v0.1.10.post3
- 合并时间：2026-04-11 00:25
- 原文链接：http://prhub.com.cn/vllm-project/vllm/pull/39509

---

# 执行摘要

- 一句话：将 ROCm 基础 Dockerfile 中的 AITER 版本从 v0.1.12 回退到 v0.1.10.post3，解决已知 bug 和标签移动问题。
- 推荐动作：该 PR 变更简单直接，值得快速合并以解决紧急问题。建议阅读者关注关联 Issue #39303 和 #39485 以了解 bug 详情，并跟踪 AITER 上游的稳定版本发布。对于 ROCm 平台开发者，需注意此回退是临时措施，长期需等待 AITER v0.1.12 的稳定修复版本。

# 功能与动机

根据 PR body 和关联 Issue，回退 AITER 版本有两个主要原因：1）AITER v0.1.12 标签频繁移动（Issue #2691），导致无法追踪构建使用的具体提交，破坏了版本管理的可靠性；2）v0.1.12 存在多个已知 bug，包括 DeepSeek blockscaled gemm 运行时错误（Issue #39485）和 GLM-5.1-FP8 解码在 context_len>2048 时产生随机 topk 的问题（Issue #39303），这些 bug 影响了模型推理的正确性。

# 实现拆解

本 PR 仅修改了一个文件：docker/Dockerfile.rocm_base。将第 12 行的 ARG AITER_BRANCH 从 "v0.1.12" 改为 "v0.1.10.post3"。这是一个直接的版本回退，不涉及任何代码逻辑变更，仅影响 Docker 构建时拉取的 AITER 版本。

关键文件：
- `docker/Dockerfile.rocm_base`（模块 docker）: 这是唯一修改的文件，控制了 ROCm 基础 Docker 镜像中 AITER 依赖的版本，直接影响所有基于此镜像的 ROCm 平台构建和运行时行为。

关键符号：未识别


# 评论区精华

Review 讨论非常有限。gemini-code-assist[bot] 仅确认了变更内容，没有提供实质性反馈。gshtras 直接批准了 PR，表明团队对回退决策有共识。没有出现关于回退策略、替代方案或长期计划的讨论。

- 版本回退的必要性 (correctness): 团队一致同意回退到 v0.1.10.post3 作为紧急修复。
- 变更影响评估 (question): 未明确讨论，但批准表明团队接受回退风险。

# 风险与影响

- 风险：风险较低但需注意：1）回退到旧版本可能丢失 v0.1.12 中已修复的其他 bug 或性能改进，但鉴于当前版本存在严重功能问题，回退是必要权衡；2）依赖管理风险：如果 v0.1.10.post3 也存在未发现的问题，可能引入新 bug；3）构建一致性风险：Docker 镜像版本变更可能影响 CI/CD 流水线的可重复性，但 PR body 未提及测试计划或验证结果。
- 影响：影响范围：1）对用户：修复了使用 ROCm 平台和 AITER 后端时 DeepSeek 和 GLM-5.1-FP8 等模型的运行时错误，恢复模型功能；2）对系统：确保 ROCm Docker 镜像构建使用稳定的 AITER 版本，避免因标签移动导致的不可预测行为；3）对团队：这是一个紧急修复，优先级高，但缺乏测试结果验证，可能需后续补充测试。影响程度中等，主要限于 ROCm 平台用户。
- 风险标记：依赖版本回退 , 缺少测试验证

# 关联脉络

- PR #37539 [Performance] Remove unnecessary zero-fill of MLA decode output tensor in Aiter backend: 同样涉及 ROCm 平台和 AITER 后端优化，关注性能改进，而本 PR 是稳定性修复。
- PR #37352 [Kernel][Hardware][AMD] Add TritonW4A16LinearKernel for ROCm: 同为 ROCm 平台相关 PR，涉及内核和量化支持，显示团队对 AMD 生态的持续投入。