Repositories / vllm-project / vllm

vllm-project/vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

监控状态：已开启最近同步：2026-06-04 08:41 同步状态：空闲下次计划：2026-06-04 09:41

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-06-01

#44153 [Frontend] Resettle generative scoring entrypoint.

原始 PR · 作者 noooop · 合并时间 2026-06-01 15:54

重构重要性 8.06 洞察度 5.00

迁移 generative scoring 入口并重命名服务类

值得关注，该 PR 展示了如何正确进行入口点重构，包括安全导入处理（相对导入）、状态初始化统一管理，以及 CI 配置同步。适合作为类似重构的参照。

refactorfrontendcleanup

#42944 fix: glm5.1 pp model loading

原始 PR · 作者 UranusSeven · 合并时间 2026-06-01 15:14

缺陷修复重要性 6.89 洞察度 5.00

修复 GLM5.1 的 FP8 模型在 PP 模式下的加载失败

建议精读 `_try_load_fp8_indexer_wk` 的改动以理解 PP 下权重加载的最佳实践。该 PR 改动简洁、目标明确，是学习如何为已有加载逻辑添加 PP 支持的好例子。

bugfixmodeldeepseek

#42730 [CPU][RISC-V] Add missing RVV cpu_types helpers for WNA16

原始 PR · 作者 wcynb1023 · 合并时间 2026-06-01 14:56

功能重要性 5.99 洞察度 5.00

为RISC-V CPU添加WNA16量化所需RVV向量辅助函数

对于关注RISC-V后端或CPU量化路径的读者，本PR展示了如何扩展`cpu_types`以支持新ISA，特别是使用RVV vrgather优化LUT查表的模式值得学习。建议精读`cpu_types_riscv_impl.hpp`中的新构造函数和`interleave_save`实现。

cpuquantizationfeature

#44159 [Docs] Replace broken video url in examples

原始 PR · 作者 Isotr0py · 合并时间 2026-06-01 14:01

其他重要性 3.23 洞察度 1.00

修复文档和示例中的失效视频链接

该 PR 价值较低但属于必要的维护工作。建议在日常文档维护中关注 URL 有效性，或引入自动化链接检查。

documentationcleanup

#44035 [BugFix] Fix `_has_module` to verify native deps via trial import

原始 PR · 作者 jeffreywang-anyscale · 合并时间 2026-06-01 13:06

缺陷修复重要性 6.91 洞察度 5.00

修复 _has_module 通过 trial import 验证本机依赖

值得精读，因为它修复了一个隐蔽的 bug，并展示了一种稳健的模块可用性检测模式（trial import），设计决策（异常处理范围、日志记录）也有参考价值。

bugfixinfratest

#44078 [MRV2] Remove Eagle's dedicated CUDA graph pool

原始 PR · 作者 LucasWilkinson · 合并时间 2026-06-01 13:00

重构重要性 6.56 洞察度 3.00

移除 Eagle 专用 CUDA 图池，节省显存

值得快速合并，属于干净的清理变更。可留意未来是否有 Eagle 内存冲突报告。

v1refactorcleanup

#36254 [Misc] Use VLLMValidationError consistently in chat completion and completion protocol validators

原始 PR · 作者 umut-polat · 合并时间 2026-06-01 12:04

缺陷修复重要性 6.96 洞察度 5.00

统一使用 VLLMValidationError 并修复 structured_outputs 校验逻辑

此 PR 变更清晰，修复了一个实际 bug，并提升了 API 错误诊断能力。值得精读的点包括：如何通过统一的异常类型和 parameter 字段提高错误信息的可操作性，以及如何通过细粒度的 parameter 值提供更精确的错误定位。建议在类似验证场景中推广此模式。

bugfixrefactorfrontend

#44118 docs: fix MLA attention docstring examples

原始 PR · 作者 nightcityblade · 合并时间 2026-06-01 03:28

文档重要性 5.44 洞察度 3.00

修复 MLA attention docstring 示例错误

该 PR 属于纯文档修正，变更简单明确，无需深度阅读。但可视为文档质量改进的典范：通过 issue 驱动，精准修复，测试验证。