Repositories / vllm-project / vllm

vllm-project/vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

监控状态：已开启最近同步：2026-06-04 09:45 同步状态：空闲下次计划：2026-06-04 10:45

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-05-13

#42313 platforms: add uses_cpu_device() hook to Platform for DeviceConfig

原始 PR · 作者 viktorpusTT · 合并时间 2026-05-13 03:39

功能重要性 5.97 洞察度 5.00

添加平台钩子支持 CPU 设备处理

值得精读。这个 PR 展示了如何在大型项目中使用抽象基类方法替代硬编码判断，以最小的入侵实现扩展性。特别是 review 中对条件逻辑的修正和对命名的讨论，体现了防御性编程和领域语义的重要性。对于分布式推理系统的平台抽象层设计有参考价值。

featurerefactorinfra

#42446 [CI] Migrate 6 verified jobs from gpu_1_queue to h200_18gb MIG

原始 PR · 作者 khluu · 合并时间 2026-05-13 02:52

基础设施重要性 3.56 洞察度 3.00

将6个 CI 任务从 L4 迁移到 H200 MIG

值得关注但不需精读。该 PR 是 CI 资源优化的一部分，展示了在 MIG 分区上运行 vLLM 测试的可行性边界。Python-only Installation 任务的设备分配问题建议后续优化。

cici/build

#42333 [Model][Bugfix] Fix Step3-VL image_embeds input path

原始 PR · 作者 KaivalyaMDabhadkar · 合并时间 2026-05-13 02:47

缺陷修复重要性 7.23 洞察度 4.00

修复 Step3-VL image_embeds 输入路径的字段映射与控制流

建议开发多模态模型的团队精读此 PR，特别是 `TensorSchema` 字段映射约定和控制流隔离的设计。展示了如何通过保持 schema 字段名一致性来避免类似问题。

bugfixmodelmulti-modality

#41055 [MoE Refactor] EPLB refactoring for FusedMoE

原始 PR · 作者 bnellnm · 合并时间 2026-05-13 02:16

重构重要性 7.54 洞察度 5.00

用 Optional EplbLayerState 替代 enable_eplb 标志，简化 MoE 路由接口

建议阅读该 PR，尤其关注 `EplbLayerState.set_layer_state` 的方法设计，以及 `BaseRouter` 中从标志驱动转向 Optional 状态驱动的演变过程。这一模式在类似的特征标记场景下值得借鉴：使用 Optional 对象替代布尔标志和强制初始化对象，可以有效避免标志与对象不一致的问题，并使接口更简洁。

refactormoecleanup

#40735 [MoE Refactor] Introduce RoutedExperts alias for FusedMoE and don't store SharedExperts in MK

原始 PR · 作者 bnellnm · 合并时间 2026-05-13 01:37

重构重要性 8.65 洞察度 5.00

引入 RoutedExperts 别名并解耦 SharedExperts 存储

值得精读，尤其关注 `modular_kernel.py` 中如何将 SharedExperts 从内部状态改为方法参数，这是典型的解耦模式。对于 MoE 重构系列，理解此 PR 有助于后续理解 PR#38590 的更大变更。

refactormoecleanup

#42189 [Bugfix] [Frontend] Responses API, fix merging of messages

原始 PR · 作者 yzong-rh · 合并时间 2026-05-13 00:10

缺陷修复重要性 8.02 洞察度 5.00

修复 Responses API 消息合并，合并连续 assistant 消息

该 PR 值得精读，尤其是学习如何通过函数签名设计（prev_msg 参数）将隐式的合并策略直接集成到构造逻辑中，替代独立的合并函数。review 中关于类型安全的讨论也值得参考。

bugfixfrontendtest

2026-05-12

#40984 feat(kv-events): emit KV cache metadata

原始 PR · 作者 PeaBrane · 合并时间 2026-05-12 23:58

功能重要性 8.27 洞察度 6.00

为 KV 事件添加缓存类型与滑动窗口元数据

精读核心设计决策，特别是关于状态位置（事件携带 vs 独立查询）的权衡；该模式也可用于其他需要区分实例 identity 的事件系统。

featurev1kv-connector

#42225 [CPU] Fix rotary embedding for CPU without flash-attn ops

原始 PR · 作者 jmamou · 合并时间 2026-05-12 23:05

缺陷修复重要性 5.88 洞察度 4.00

修复 CPU 环境下 Rotary Embedding 导入 flash_attn 崩溃

值得立即合并。改动极小，修复明确，已通过实际模型验证。建议合并后补充 CPU 环境下的 CI 测试，覆盖 RoPE 模型加载场景。

bugfixcpukernel

第 88 / 269 页 · 共 2150 条

上一页 1 … 86 87 88 89 90 … 269 下一页