Prhub
← 返回仓库详情

标签聚合

vllm-project/vllm · 标签视图

标签列表

聚合结果

xpu 相关 PR

2026-04-18

#39844 [XPU] fix all_reduce all-zero accuracy issue under torch.compile

作者 chaojun-zhang · 合并时间 2026-04-18 10:33

缺陷修复 重要性 5.86 洞察度 6.00

修复 XPU 平台在 torch.compile 模式下 all_reduce 返回全零的精度问题。

xpu bugfix v1 kernel compilation

该 PR 值得精读,因为它揭示了 torch.compile 在优化 in-place 操作时可能导致的隐蔽精度问题,并展示了通过 out-of-place 操作规避编译器优化的实用技巧。关注点:条件克隆的逻辑设计(`torch.compiler.is_compiling()`)和类型提示的添加如何提升代码健壮性。

#39984 [XPU]fake impl for xpu fp8_gemm

作者 xinyu-intel · 合并时间 2026-04-18 08:53

功能 重要性 6.17 洞察度 4.00

为 XPU 平台添加 fp8_gemm 的假实现以支持 torch.compile。

xpu feature v1 quantization kernel

此 PR 值得关注其假实现的设计模式,但需注意形状处理可能存在的风险。建议阅读 `vllm/_xpu_ops.py` 文件,了解如何为自定义算子注册假实现以支持 torch.compile。

#39957 skip fp8e4b15 on xpu

作者 xinyu-intel · 合并时间 2026-04-18 00:55

缺陷修复 重要性 5.03 洞察度 4.00

在XPU上跳过fp8e4b15格式,扩展TurboQuant测试到XPU平台。

v1 bugfix quantization xpu test

建议阅读此PR以了解如何扩展平台抽象支持,特别是设备检测和格式选择的设计决策,适用于处理多平台兼容性场景。

2026-04-16

#39671 use spawn multiproc method on xpu

作者 xinyu-intel · 合并时间 2026-04-16 14:42

基础设施 重要性 4.72 洞察度 3.00

在XPU平台上强制设置多进程方法为spawn,避免用户手动配置fork导致崩溃。

xpu v1

该PR变更简单直接,但揭示了平台特定约束的设计决策。值得关注的是review中关于强制覆盖与用户显式配置的权衡讨论,这反映了基础设施代码中用户体验与灵活性的平衡。

2026-04-15
缺陷修复 重要性 4.90 洞察度 3.00

修复XPU平台编码器注意力中量化查询输入不支持的问题,将q_descale参数设为None。

xpu bugfix v1 quantization attention

该PR值得快速浏览,以了解XPU平台量化支持的限制及修复方式;关注`supports_quant_query_input`标志的使用,这可能在其他注意力后端中也有类似模式。

#39857 [XPU][MXFP4] add mxfp4 quant op for XPU

作者 zufangzhu · 合并时间 2026-04-15 20:28

功能 重要性 6.91 洞察度 5.00

为XPU平台添加MXFP4量化算子支持,扩展低精度推理能力。

xpu quantization feature v1 kernel

建议关注此PR作为XPU平台量化支持扩展的示例,但需注意其输入维度限制和fake实现不完整的问题。对于后续开发,应参考review建议将算子泛化为N-D支持并强化错误检查。

2026-04-13
功能 重要性 6.00 洞察度 5.00

为 XPU 平台添加 MXFP8 量化 GEMM 内核和新压缩张量方案。

xpu quantization kernel feature v1

建议技术管理者关注此 PR 以了解 XPU 量化扩展策略,工程师可精读 `xpu.py` 中的内核实现,学习如何适配新平台的量化计算和设计回退机制。

#35698 [XPU]Enhance environment collection for Intel XPU and optimize layout

作者 1643661061leo · 合并时间 2026-04-13 12:51

功能 重要性 4.00 洞察度 5.00

扩展环境收集脚本以支持Intel XPU,优化信息分类与显示。

xpu documentation v1

建议技术管理者关注此PR中包检测函数的设计,了解其潜在改进点;工程师可精读get_pkg_version()的实现,学习如何处理多包管理器适配,并注意条件输出逻辑如何优雅处理平台差异。