# PR #5578 完整报告

- 仓库：`verl-project/verl`
- 标题：[ci] chore: change machine for npu ci
- 合并时间：2026-03-13 18:26
- 原文链接：http://prhub.com.cn/verl-project/verl/pull/5578

---

# 执行摘要

- 一句话：将 NPU CI 流水线机器从 A2-8 升级到 A2B3-8，并更新 Docker 镜像仓库。
- 推荐动作：该 PR 值得 CI 维护者或关注 NPU 测试环境的工程师精读，以了解环境升级的细节。对于大多数开发者，变更简单，可快速浏览文件列表确认影响范围。关注点包括机器类型升级的合理性（如性能提升）和镜像迁移的背景。

# 功能与动机

PR body 中仅说明 'change machine for npu ci'，未提供详细动机。从变更推断，可能是为了利用更新、性能更优的机器类型（A2B3-8），或响应镜像仓库的迁移需求，以优化 CI 流水线的稳定性和速度。

# 实现拆解

实现方案集中在 CI 工作流配置层：
- 统一修改 8 个 `.github/workflows/*_ascend.yml` 文件中的 `runs-on` 字段，从 `linux-aarch64-a2-8` 改为 `linux-aarch64-a2b3-8`。
- 更新 `container.image` 字段，将镜像仓库从 `swr.ap-southeast-1.myhuaweicloud.com/base_image/ascend-ci/verl/verl:verl-8.5.0-910b-ubuntu22.04-py3.11-latest` 切换到 `swr.cn-southwest-2.myhuaweicloud.com/modelfoundry/ascend-ci/verl/verl:verl-8.5.0-910b-ubuntu22.04-py3.11-latest`。
- 在部分文件（如 `e2e_ascend.yml`）中移除了配置第三方依赖下载缓存的步骤，可能因为这些缓存服务已不再需要或整合到新环境中。

关键文件：
- `.github/workflows/e2e_ascend.yml`（模块 CI）: 核心 NPU 端到端测试工作流，变更直接影响 RL 训练场景的验证。
- `.github/workflows/nightly_ascend.yml`（模块 CI）: 夜间 NPU CI 流水线，对长期测试稳定性和回归检测关键。

关键符号：未识别


# 评论区精华

Review 过程中无实质性讨论，仅有 reviewer wucong25 的批准（APPROVED），表明变更被认为直接且无争议。

- 暂无高价值评论线程

# 风险与影响

- 风险：技术风险较低但需关注：
- **环境兼容性风险**：新机器类型 `a2b3-8` 可能硬件配置不同，若未充分测试，可能导致 NPU 驱动或性能问题。
- **镜像可用性风险**：镜像仓库切换后，若新镜像未正确构建或权限问题，可能引发 CI 作业失败。
- **回归风险**：移除缓存配置步骤可能影响依赖下载速度，但根据变更，这可能是优化的一部分。所有风险集中在修改的 YAML 文件中，需通过后续 CI 运行验证。
- 影响：影响范围限于 CI 基础设施：
- **对用户**：开发者提交代码后，NPU 相关测试将在新机器上运行，可能影响 CI 执行时间和成功率。若变更顺利，可能提升测试效率。
- **对系统**：确保 NPU 训练和测试流水线与更新后的硬件和镜像环境保持一致，避免因旧环境退役导致的中断。
- **对团队**：需要监控 CI 结果以确认变更无副作用，但无代码逻辑变更，因此对产品功能无直接影响。
- 风险标记：环境变更风险 , 镜像源切换

# 关联脉络

- PR #5887 [ci] fix: fix machine label for nightly_ascend.yml: 同样涉及 NPU CI 机器标签的修正，可能互为补充或共享配置背景。
- PR #5680 [trainer] feat: add mindspeedllm backend engine support on NPU.: 扩展 NPU 平台功能，本 PR 的 CI 变更可能为支持新硬件环境做准备。