Repositories / vllm-project / vllm

vllm-project/vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

监控状态：已开启最近同步：2026-06-01 07:21 同步状态：空闲下次计划：2026-06-01 08:21

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-03-27

#38136 Fix multi-node allreduce fusion

原始 PR · 作者 wzhao18 · 合并时间 2026-03-27 04:24

缺陷修复重要性 6.00 洞察度 5.00

修复多节点设置下FlashInfer allreduce融合后端选择问题，避免hang。

对于涉及分布式训练或多节点部署的工程师，此PR值得精读，以理解FlashInfer allreduce后端选择策略和兼容性处理。关注 `_resolve_fi_ar_backend()` 函数的设计决策，以及如何平衡性能与兼容性。

bugfixperformancecudagraph

#37547 [Bugfix][ROCm] Fix lru_cache on paged_mqa_logits_module

原始 PR · 作者 gronsti-amd · 合并时间 2026-03-27 03:01

缺陷修复重要性 4.00 洞察度 2.00

修复ROCm后端paged_mqa_logits_module的lru_cache失效，提升性能。

建议快速审查此PR，以理解lru_cache的正确使用方式。关注设计决策：确保缓存函数在模块级别定义以避免作用域问题。对于工程师，这是一个学习Python装饰器和性能优化的好例子，值得精读其简单但有效的修复思路。

bugfixrocmfp8

#38263 [ROCm] [Bugfix] [Release] Fix nightly rocm release pipeline

原始 PR · 作者 tjtanaa · 合并时间 2026-03-27 02:47

缺陷修复重要性 4.00 洞察度 3.00

修复 ROCm 夜间发布管道中的未绑定变量错误并移除无效部分缓存逻辑。

该 PR 值得 CI 维护者和 ROCm 开发者关注，尤其是缓存逻辑的简化决策。建议精读 review 讨论，评估是否应重新添加 `--push` 标志以恢复缓存机制，并监控构建性能变化。

bugfixrocmci

#38165 [ROCm][CI] Override PYTORCH_ROCM_ARCH with detected GPU arch in test containers

原始 PR · 作者 AndreasKaratzas · 合并时间 2026-03-27 02:33

基础设施重要性 4.00 洞察度 4.00

修复 ROCm 测试容器中 GPU 架构检测，避免 JIT 编译所有架构，提升测试效率。

对于从事 CI/CD 或 ROCm 集成的工程师，此 PR 值得一读以了解如何优化环境变量管理以激活自动检测逻辑。重点关注环境变量覆盖的策略和脚本稳定性的改进点，如避免 grep 命令的风险。

rocmcitest

#37930 [ROCm][CI] Add uv pip compile workflow for rocm-test.txt lockfile

原始 PR · 作者 AndreasKaratzas · 合并时间 2026-03-27 01:44

基础设施重要性 5.00 洞察度 5.00

为ROCm测试环境添加uv pip compile工作流以生成锁文件。

建议ROCm和CI相关工程师精读此PR，重点关注排除列表的设计决策、验证步骤的实现，以及未来uv工具更新的优化可能。对于其他开发者，可快速浏览以了解vLLM依赖管理流程的演变。

rocmci

#37228 [ROCM][Bugfix] Use correct stride in cp_mha_gather_cache_kernel for hybrid model (#37228)

原始 PR · 作者 jennyyyyzhen · 合并时间 2026-03-27 01:33

缺陷修复重要性 5.00 洞察度 6.00

修复ROCM后端在混合模型下KV缓存非连续内存访问错误，避免注意力输出NaN。

该PR值得精读，尤其关注Triton内核中处理非连续内存的通用模式。设计决策亮点：采用传递stride而非仅第一维stride，以预防未来其他维度非连续导致的静默错误。建议团队审查其他类似内核是否存在相同假设，并优先修复shuffle路径问题。

bugfixrocmkv-connector

#38155 [ROCm][CI] Add LM Eval Qwen3.5 Models test for MI355

原始 PR · 作者 AndreasKaratzas · 合并时间 2026-03-27 00:51

测试重要性 3.00 洞察度 2.00

在AMD MI355 GPU上添加Qwen3.5模型评估测试的CI条目。

对于关心ROCm CI测试或Qwen模型的工程师，此PR值得快速浏览以了解测试配置；对于其他人员，无需深入阅读。

rocmcitest

#38178 [CI] Fix conch kernel crash on 3D input by reshaping to 2D before GEMM

原始 PR · 作者 AndreasKaratzas · 合并时间 2026-03-27 00:46

缺陷修复重要性 4.00 洞察度 3.00

修复 conch 内核在 3D 输入下的崩溃，通过重塑为 2D 以适应 GEMM 操作。

此 PR 值得快速 review 和合并，因为它是简单 bugfix；建议关注重塑逻辑是否正确处理各种输入形状，并参考 machete 内核的实现以确保一致性。

rocmbugfixquantization

第 230 / 253 页 · 共 2021 条

上一页 1 … 228 229 230 231 232 … 253 下一页