Repositories / vllm-project / vllm

vllm-project/vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

监控状态：已开启最近同步：2026-06-13 18:37 同步状态：空闲下次计划：2026-06-13 19:37

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-06-02

#43754 [HARDWARE][POWER] Enable SHM communicator support for PowerPC

原始 PR · 作者 Rukhaiya2004 · 合并时间 2026-06-02 18:06

功能重要性 6.73 洞察度 5.00

为 PowerPC 启用 SHM 通信器支持

值得关注的设计决策： - 采用条件宏而非抽象接口扩展平台支持，保持了最小改动量，适合成熟模块的横向移植。 - 通过新增 `FP16Vec16` 类型而非修改原有类型转换逻辑，避免了影响 x86/ARM 的代码路径。 - 自旋等待指令的低级优化体现了对微架构特性的深入理解，可作为跨平台 busy-wait 模式的参考。建议后续为 PowerPC 添加 CI 运行或至少补充集成测试，以确保长期兼容性。

cpuinfrafeature

#44126 [Multimodal] Automatically select registered video loader for VLM

原始 PR · 作者 Isotr0py · 合并时间 2026-06-02 17:09

功能重要性 8.22 洞察度 5.00

自动根据模型 VideoProcessor 选择视频加载后端

值得精读，了解多模态基础设施中的注册与自动发现模式。设计上保持了向后兼容（未指定 `video_processor` 时行为不变），是渐进式改进的范例。

featuremulti-modalityfrontend

#42977 [Parser] Migrate `ResponsesParser` to unified `Parser` interface

原始 PR · 作者 albertoperdomo2 · 合并时间 2026-06-02 16:50

重构重要性 7.91 洞察度 6.00

迁移 ResponsesParser 到统一 Parser 接口

该 PR 值得精读，展示了将遗留组件迁移到统一接口的典型模式。重点关注 `ResponsesParser.process()` 的简化和流式处理的缓存设计（未来改进方向）。建议合并后尽快跟进流式问题的 CI 测试。

refactorfrontendparser

#41627 [EC Connector] Non blocking EC Connector lookup

原始 PR · 作者 omerpaz95 · 合并时间 2026-06-02 16:48

功能重要性 7.12 洞察度 6.00

为EC连接器引入非阻塞查询机制，允许调度器延迟等待多模态编码缓存预取的请求。

建议精读该PR的核心设计：`ensure_cache_available` 接口定义与调度器集成点，特别是如何通过非阻塞延迟提升吞吐。对于连接器实现者，应关注后续PR #42998 以了解完整用法。代码质量和测试覆盖良好，值得 merge。

kv-connectorschedulerv1

#44165 [Core][Refactor]: thread `scheduler_block_size` into KVCacheManager and KVCacheCoordinator

原始 PR · 作者 ivanium · 合并时间 2026-06-02 16:14

重构重要性 6.97 洞察度 5.00

将调度块大小显式注入 KV 缓存管理层

建议深入阅读此 PR，了解 vLLM KV 缓存管理层的分层架构（`KVCacheManager` → `KVCacheCoordinator` → `SingleTypeKVCacheManager`）和如何通过逐步显式化设计为大型重构做准备。值得关注的设计决策：使用断言确保不变性，将重复计算集中化。

refactorv1kv-connector

#43883 [Rust Frontend] add --enable-request-id-headers flag support.

原始 PR · 作者 cinnamonica02 · 合并时间 2026-06-02 16:08

功能重要性 8.04 洞察度 5.00

Rust 前端新增 --enable-request-id-headers 参数支持

值得精读。展示了 Rust 前端功能补齐的典型流程，特别是 CLI 参数定义、中间件集成、条件路由层注册。Review 中关于 negative form 的设计讨论说明了对 clap 和参数传递路径的深入理解，对后续 Rust 前端开发有参考价值。

featurefrontend

#44177 [kv_offload] Add `@override` decorators to subclass method implementations

原始 PR · 作者 ronensc · 合并时间 2026-06-02 16:07

重构重要性 5.67 洞察度 3.00

为 KV offload 子类方法添加 @override 装饰器

值得阅读以了解 kv_offload 子系统的基类层次和接口设计。该 PR 也展示了如何低成本地将静态检查实践引入大型项目，推荐作为团队标准。

refactorv1cleanup

#43534 [CPU][Perf] Enable fused kernels for GDN's gated delta rules

原始 PR · 作者 fadara01 · 合并时间 2026-06-02 16:00

性能优化重要性 8.59 洞察度 6.00

CPU GDN 融合内核性能提升 50%

值得精读，特别关注其 ISA 无关的 BLAS 回退架构和编译时分支策略，该模式可推广至其他需要跨平台性能优化的算子。建议阅读文件：`csrc/cpu/sgl-kernels/blas_gemm.h` 和 `gemm.h` 中的 `brgemm_supported` 设计。

performancecpukernel

第 55 / 312 页 · 共 2496 条

上一页 1 … 53 54 55 56 57 … 312 下一页