Prhub

#39656 [XPU] revert torch-xpu to 2.10

vllm-project/vllm · 作者 jikunshang · 合并时间 2026-04-13 10:50

分析状态 已生成
文件变更 2提交数 1 · 评论 1
代码增减 +24 / -24
xpu v1

执行摘要

将 XPU 相关依赖从 2.11.0 降级回 2.10.0,以解决 oneCCL 依赖问题。

根据PR body的描述,"oneccl dependecy of xpu stack is not ready yet. so revert back to 2.10 to not break functionality and CI.",即Intel XPU栈的oneCCL依赖尚未准备就绪,因此需要回退到2.10版本以确保功能正常和CI通过。

此PR为基础设施调整,逻辑简单,无需精读。建议关注:1. 后续是否有PR解决oneCCL依赖并升级回2.11.0。2. 注意torchvision版本不一致可能带来的环境问题。

讨论亮点

review中只有一条评论,来自gemini-code-assist[bot],指出requirements/xpu.txt中torchvision版本未固定,与test/xpu.txt中的0.25.0+xpu不一致,可能导致环境差异。但该评论未得到回复或采纳,PR最终被批准合并,未对torchvision版本进行额外固定。

实现拆解

此PR修改了两个依赖文件:1. requirements/xpu.txt:将torch从2.11.0+xpu降级为2.10.0+xpu。2. requirements/test/xpu.txt:将torch从2.11.0+xpu降级为2.10.0+xpu,同时将torchvision从0.26.0+xpu降级为0.25.0+xpu,并同步降级了多个Intel运行时库(如dpcpp-cpp-rt、intel-sycl-rt、oneccl等)的版本。

文件 模块 状态 重要度
requirements/test/xpu.txt 依赖管理 modified 7.0
requirements/xpu.txt 依赖管理 modified 5.0

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

torchvision 版本不一致问题 正确性

gemini-code-assist[bot] 指出 requirements/xpu.txt 中 torchvision 版本未固定,与 test/xpu.txt 中的 0.25.0+xpu 不一致,可能导致环境差异。

结论:未得到回复或采纳,PR 直接合并。 · 未解决

风险与影响

风险较低但需注意:1. 版本降级可能引入已知bug或缺失新功能,但鉴于目的是解决依赖问题,风险可控。2. 两个依赖文件中torchvision版本不一致(xpu.txt未固定,test/xpu.txt固定为0.25.0+xpu),可能导致开发、CI和生产环境差异,但review中未解决此问题。3. 依赖降级可能影响XPU栈的长期维护,需后续跟进oneCCL依赖的解决。

影响范围限于使用Intel XPU的开发和测试环境:1. 用户:使用XPU的开发者需重新安装降级后的依赖,但可避免因oneCCL问题导致的功能中断。2. 系统:确保XPU栈在CI和开发环境中稳定运行。3. 团队:暂时回退到旧版本,待依赖就绪后需再次升级。

版本降级 依赖不一致

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

执行摘要

此PR将Intel XPU相关依赖从2.11.0版本回退到2.10.0,主要修改requirements/xpu.txtrequirements/test/xpu.txt文件,以解决oneCCL依赖未就绪导致的功能中断和CI失败问题。这是一个临时性的基础设施调整,风险较低,但需注意后续依赖升级和版本一致性问题。

功能与动机

根据PR body,动机明确:"oneccl dependecy of xpu stack is not ready yet. so revert back to 2.10 to not break functionality and CI." 即Intel XPU栈的oneCCL依赖尚未准备就绪,因此需要暂时降级依赖版本,确保XPU功能在开发和CI环境中稳定运行。

实现拆解

PR修改了两个依赖文件,具体变更如下:

文件 关键变更 说明
requirements/xpu.txt torch==2.11.0+xputorch==2.10.0+xpu 基础依赖降级
requirements/test/xpu.txt 多行版本降级,包括:
- torch==2.11.0+xputorch==2.10.0+xpu
- torchvision==0.26.0+xputorchvision==0.25.0+xpu
- 多个Intel运行时库(如onecclintel-sycl-rt等)从2025.3.22025.3.1降级到2025.3.12025.3.0
测试环境依赖同步降级

评论区精华

review中仅有一条来自gemini-code-assist[bot]的评论:

"The torchvision version should be pinned in requirements/xpu.txt to match the 0.25.0+xpu version specified in requirements/test/xpu.txt. Leaving it unpinned in the base requirements file while pinning it in the test requirements creates an inconsistency that can lead to different environments between development, CI, and production."

该评论指出基础依赖文件中torchvision版本未固定,可能导致环境不一致,但未得到回复或采纳,PR直接合并。

风险与影响

  • 风险:版本降级可能引入旧bug或缺失新功能;两个文件中torchvision版本不一致(基础文件未固定,测试文件固定为0.25.0+xpu)可能引发环境差异。
  • 影响:仅影响使用Intel XPU的开发和测试环境,用户需重新安装降级依赖,但可避免oneCCL问题导致的中断。

关联脉络

  • 与近期XPU相关PR(如#37731、#38316)同属XPU技术栈,但本PR是依赖降级而非功能扩展。
  • 此PR为临时措施,预计后续会有PR在oneCCL依赖就绪后重新升级到2.11.0版本。

参与讨论