Repositories / vllm-project / vllm

vllm-project/vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

监控状态：已开启最近同步：2026-05-31 03:31 同步状态：空闲下次计划：2026-05-31 04:31

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-05-01

#41389 [CI/Build] Skip Prithvi/Terratorch model-registry tests when terratorch is missing

原始 PR · 作者 stecasta · 合并时间 2026-05-01 03:47

缺陷修复重要性 4.79 洞察度 3.00

跳过因 terratorch 缺失而失败的测试

值得快速审阅，以确认跳过逻辑正确，确保 test_initialization.py 和 test_registry.py 中的内联检查与现有模式一致，且模块级 skipif 按预期工作。

ci/buildtestbugfix

#40472 [CI] Add MTP coverage: Qwen3.5 correctness + no-sync spec decode

原始 PR · 作者 stecasta · 合并时间 2026-05-01 03:24

测试重要性 5.20 洞察度 4.00

为Qwen3.5 MTP新增spec-decode CI测试覆盖

建议合并。该 PR 针对测试矩阵的空白进行了精准补充，并且设计决策（阈值选择、兼容性跳过、视觉塔限制）都基于实测数据，具有一定参考价值。

testqwenci/build

#41374 [DSV4] Avoid redundant dtype conversion.

原始 PR · 作者 jeejeelee · 合并时间 2026-05-01 00:57

重构重要性 6.23 洞察度 3.00

消除 DeepSeek V4 冗余类型转换

建议合并。这是一个小的性能优化，逻辑清晰，且已通过代码审查。值得关注的模式：用 `if cond and val is None` 替代嵌套 `if` 来简化条件，以及通过条件分支避免不必要的类型转换。

deepseekperformancerefactor

#41380 xpu docker: pin oneAPI to 2025.3 and avoid unintended 2026 upgrade

原始 PR · 作者 wendyliu235 · 合并时间 2026-05-01 00:02

基础设施重要性 4.36 洞察度 5.00

Intel XPU Docker 镜像 oneAPI 版本锁定及构建优化

该 PR 是良好的基础设施维护变更，体现了对构建确定性的重视。建议团队在类似 Docker 镜像中也采用 APT Pin 机制来锁定关键依赖版本。值得精读以了解 Docker 构建最佳实践。

intel-gpuci/buildcleanup

2026-04-30

#41377 [CI/Build] Skip terratorch + torchgeo while PyPI has lightning quarantined

原始 PR · 作者 stecasta · 合并时间 2026-04-30 22:59

基础设施重要性 5.10 洞察度 3.00

临时注释 terratorch 依赖修复 pip-compile 失败

建议精读此 PR 以学习如何优雅处理外部依赖中断：使用 `pytest.importorskip` 或模块级 `find_spec` + `skipif` 跳过测试，并添加清晰注释和关联 issue 以便后续恢复。该模式可在其他类似场景复用。

ci/buildtestcleanup

#39721 [ROCm] ROCm DeepEP API updated to latest

原始 PR · 作者 itej89 · 合并时间 2026-04-30 22:47

功能重要性 7.11 洞察度 5.00

统一ROCm DeepEP API并更新Docker构建

该PR值得精读，尤其是关注如何通过移除平台分支实现API统一，以及Docker构建的最佳实践（如条件安装rdma-core）。对于ROCm平台开发者有重要参考价值。

rocmci/buildmoe

#41268 [UX][Bugfix] Fix OOM by setting PyTorch `max_split_size_mb` during model loading

原始 PR · 作者 MatthewBonanni · 合并时间 2026-04-30 22:46

缺陷修复重要性 6.96 洞察度 7.00

修复 PyTorch 内存碎片导致 OOM

值得精读，尤其是理解 PyTorch CUDA 内存分配器 `max_split_size_mb` 的作用和碎片化问题的诊断方法。对于维护者，需关注 sleep mode 下的副作用并准备后续修复。

bugfixperformancev1

#40013 [EPLB] Optimize memory overhead in Nixl communicator

原始 PR · 作者 ilmarkov · 合并时间 2026-04-30 22:46

性能优化重要性 7.91 洞察度 6.00

通过消除按目标复制优化 NIXL EPLB 通信内存，从 14GiB 降至 4.4GiB

值得精读，特别是 `NixlEplbCommunicator.execute` 三阶段设计和 `add_send` 的去重策略。了解如何通过通信模式优化减少显存占用，对理解现代 GPU 通信架构有参考价值。接口演化也展示了如何在不破坏现有后端的情况下增加功能。

performancekv-connectormoe

第 113 / 253 页 · 共 2019 条

上一页 1 … 111 112 113 114 115 … 253 下一页