Prhub

vllm-project/vllm · 标签视图

标签列表

聚合结果

ci/build 相关 PR

2026-06-04
基础设施 重要性 4.46 洞察度 5.00

将 Model Executor CI 步骤从 MI250 迁移至 MI300

值得关注:这是一个典型的“硬件代际迁移”操作,展示了在 CI 中如何因硬件能力差异(FP8 支持)而调整测试分配,对维护多硬件 CI 的团队有参考价值。

迁移四组 CUDA 内核到 libtorch stable ABI

值得精读,特别是 stable ABI 适配的模式(如使用 STD_TORCH_CHECK、STABLE_TORCH_LIBRARY_FRAGMENT 和 TORCH_BOX 宏)。对于贡献者,了解这些模式有助于参与后续迁移步骤。设计上保留 ROCm 专用 QuickReduce 在 legacy 是一个透明决策,需关注后续迁移计划。

#43659 Handle spinloop ext load failure gracefully

原始 PR · 作者 pschlan-amd · 合并时间 2026-06-04 00:09

缺陷修复 重要性 4.62 洞察度 3.00

优雅处理 spinloop 扩展加载失败

简单且必要的健壮性改进,值得快速合并。日志系统使用的规范值得其他开发者参考。

2026-06-03

#44425 [CI/Build] Fix LoRA testing

原始 PR · 作者 jeejeelee · 合并时间 2026-06-03 23:58

缺陷修复 重要性 6.15 洞察度 3.00

修复 LoRA 加载异常处理路径

建议合入,该 PR 修复了 LoRA 加载失败时的异常处理路径,避免内部错误暴露。虽无测试配套,但逻辑简单且改动量小,风险可控。未来可考虑补充测试用例覆盖异常路径。

功能 重要性 7.66 洞察度 5.00

启用 ROCm 的 per-token-group 量化内核

值得精读,特别是 `cmake/hipify.py` 的路径处理改进和内核的 warp 适配。设计上使用 `is_cuda_alike` 统一平台检查的做法值得借鉴。但建议在 MI300X 等目标 GPU 上进行充分的回归测试和精度对比。