执行摘要
修复 ROCm Dockerfile 中 UV 安装的静默失败,添加重试机制提高 CI 可靠性。
PR body 明确指出:'Fix silent UV installation failure in Dockerfile.rocm that causes uv: not found in the build_rixl stage. The curl ... | sh pipe masks curl failures. When curl times out, sh reads empty stdin and exits 0, so Docker reports the step as successful.' 因此,需要修复此静默失败问题,以确保 UV 在构建过程中正确安装。
建议负责 CI 基础设施的工程师快速浏览此 PR,以了解 Dockerfile 中处理网络下载的最佳实践。对于普通开发者,可作为简单 bugfix 示例参考,但无需深入解析。
在 Issue 评论中,主要讨论了超时问题是否普遍:tjtanaa 询问 'is this timeout a common problem, or it is only happening recently? Because for CPU, XPU, Cuda, their docker image is also executing the same steps.' AndreasKaratzas 回应说 'I know. I saw that this is the case for others too. My guess is slow network.' 这揭示了类似问题可能存在于其他 Dockerfile 中,但本 PR 仅聚焦于 ROCm 修复,未扩展讨论统一解决方案。Review 中自动 bot 评论无实质内容,khluu 和 tjtanaa 简单批准,无争议。
参与讨论