Repositories / vllm-project / vllm

vllm-project/vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

监控状态：已开启最近同步：2026-06-01 07:21 同步状态：空闲下次计划：2026-06-01 08:21

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-04-04

#38959 [ROCm][CI] Fix ROCm Dockerfile conftest generation for older Docker parsers

原始 PR · 作者 AndreasKaratzas · 合并时间 2026-04-04 10:41

基础设施重要性 2.00 洞察度 1.00

修复ROCm Dockerfile中conftest.py生成方式，解决旧版Docker解析器兼容性问题。

该PR变更简单直接，无需深入技术分析。对于关注CI基础设施或Dockerfile最佳实践的工程师，可快速浏览以了解heredoc与printf在Dockerfile中的兼容性差异。对于大多数开发者，无需特别关注。

rocmci

#38853 [Bug] Fix workspace manager `_current_workspaces` size

原始 PR · 作者 yewentao256 · 合并时间 2026-04-04 09:29

缺陷修复重要性 4.00 洞察度 3.00

修复WorkspaceManager中_workspaces列表大小硬编码为2的bug，改为根据num_ubatches动态初始化。

该PR值得快速浏览以理解工作空间管理器的关键修复。重点关注WorkspaceManager初始化逻辑的变化，以及如何从硬编码设计转向配置驱动设计。对于使用微批次功能的开发者，需要检查自己的num_ubatches配置是否与预期一致。

bugfixrefactor

#38915 [Bug] Fix compile error for `swap_blocks_batch` in CUDA 13

原始 PR · 作者 yewentao256 · 合并时间 2026-04-04 07:56

缺陷修复重要性 5.00 洞察度 4.00

修复CUDA 13编译错误，适配cuMemcpyBatchAsync API变更。

该PR值得精读，特别是条件编译处理CUDA API变更的模式，以及Tensor mutable_data_ptr的正确使用方式。关注CUDA版本检测宏的使用和API参数变化的设计决策。

bugfix

#38927 [Bugfix][LoRA] Fix missing in_proj_z in Qwen3_5ForConditionalGenerati…

原始 PR · 作者 elenalil-aws · 合并时间 2026-04-04 07:30

缺陷修复重要性 5.00 洞察度 3.00

修复Qwen3.5模型在LoRA启用且TP>1时加载适配器报IndexError的bug。

该PR值得快速浏览以理解Qwen3.5模型在LoRA下的模块映射机制。关注点：1) 了解GDN层在LoRA启用时从合并投影到分离投影的转换逻辑；2) 注意update_packed_mapping方法在模型初始化中的作用；3) 可结合PR #36069和#36603了解问题的演进和workaround方案。

bugfixqwenmodel

#38951 [ROCm][CI] Minor missing import patch

原始 PR · 作者 AndreasKaratzas · 合并时间 2026-04-04 07:01

缺陷修复重要性 2.00 洞察度 1.00

修复ROCm Dockerfile中pytest_unconfigure函数缺失sys导入的bug。

该PR变更简单直接，无需深入精读。对于关注ROCm CI基础设施的工程师，可快速浏览以了解Dockerfile中的测试清理逻辑。对于大多数开发者，可忽略此PR。

rocmcibugfix

#38937 [ROCm][CI] Added back missing common deps

原始 PR · 作者 AndreasKaratzas · 合并时间 2026-04-04 06:58

基础设施重要性 4.00 洞察度 4.00

恢复ROCm CI测试依赖中的通用依赖项，修复AMD CI环境。

对于负责CI或ROCm维护的工程师，建议关注此PR以理解依赖管理策略。变更较简单，但讨论揭示了-c与-r的微妙区别以及外部依赖兼容性的重要性。

rocmci

#38941 [ci] Remove soft fail for AMD image build job

原始 PR · 作者 khluu · 合并时间 2026-04-04 04:42

基础设施重要性 3.00 洞察度 2.00

移除AMD镜像构建作业的soft_fail配置，使构建失败时正确报错。

该PR变更简单，无需深入精读，但值得关注其反映的CI质量改进趋势。建议团队监控AMD构建作业的失败率，确保变更不会导致CI过度失败。

cirocm

#38238 Removed GPU state confirmation and cleanup steps.

原始 PR · 作者 dhonnappa-amd · 合并时间 2026-04-04 04:11

基础设施重要性 3.00 洞察度 2.00

移除AMD硬件CI测试脚本中的GPU状态确认和重置逻辑，适配Kubernetes环境。

该PR变更直接，适合快速浏览以理解CI环境适配。值得关注的是基础设施如何适应不同部署环境（裸机 vs Kubernetes）的设计决策，但无需深入代码细节。

rocmci

第 201 / 253 页 · 共 2021 条

上一页 1 … 199 200 201 202 203 … 253 下一页

vllm-project/vllm

PR 列表

#38959 [ROCm][CI] Fix ROCm Dockerfile conftest generation for older Docker parsers

#38853 [Bug] Fix workspace manager `_current_workspaces` size

#38915 [Bug] Fix compile error for `swap_blocks_batch` in CUDA 13

#38927 [Bugfix][LoRA] Fix missing in_proj_z in Qwen3_5ForConditionalGenerati…

#38951 [ROCm][CI] Minor missing import patch

#38937 [ROCm][CI] Added back missing common deps

#38941 [ci] Remove soft fail for AMD image build job

#38238 Removed GPU state confirmation and cleanup steps.

参与讨论