执行摘要
本 PR 修复了 .github/workflows/nightly_ascend.yml 中一个 CI 作业的机器标签配置错误,将 runs-on 从 linux-aarch64-a2-8 更正为 linux-aarch64-a2b3-8,确保 Ascend NPU 环境的 nightly CI 测试能正确调度到合适的硬件上运行。这是一个低风险、影响范围有限的 CI 基础设施修复。
功能与动机
PR 标题和 body 仅简要说明“fix machine label for nightly_ascend.yml”,未提供详细背景。从变更内容推断,原标签 linux-aarch64-a2-8 可能指向错误或已失效的机器类型,导致名为 nightlyCI_dapo-moonlight-16b-megatron-vllm_ascend 的 CI 作业无法正确运行或调度失败。修正为 linux-aarch64-a2b3-8 旨在匹配实际可用的 Ascend NPU 硬件环境,以恢复 CI 测试的可靠性。
实现拆解
仅修改一个文件 .github/workflows/nightly_ascend.yml,具体变更如下:
- 行 176:将
runs-on: linux-aarch64-a2-8 改为 runs-on: linux-aarch64-a2b3-8。
- 行 222:移除文件末尾的“No newline at end of file”标记(实为 diff 格式修正,不影响功能)。
该作业用于测试 DAPO(Diffusion Alignment Policy Optimization)在 Moonlight-16B 模型、Megatron 后端和 vLLM 环境下的 Ascend NPU nightly CI,变更后应能正确调度到 A2B3-8 硬件节点。
评论区精华
Review 过程简单,仅由 wucong25 批准,无任何评论或讨论。表明变更直接明了,无需技术争议。
风险与影响
- 风险:极低。仅修改 CI 配置,不涉及代码逻辑;若新标签仍错误,仅导致 CI 作业继续失败,不会影响生产系统。
- 影响:修复后,特定 Ascend NPU CI 作业的调度问题应得到解决,提升 nightly 测试的稳定性,对开发团队效率有轻微正面影响。
关联脉络
- 与近期 PR #5880(修复 CI 作业名不匹配)类似,都属于 CI 配置的微小修复。
- 结合历史 PR 分析,verl 项目持续优化 CI 流水线(如 #5724 升级依赖、#5864 调整 NPU 脚本),本 PR 是这一趋势中的常规维护动作,确保 Ascend NPU 测试环境与硬件资源对齐。
参与讨论