Prhub

vllm-project/vllm 周报

按周沉淀已分析 PR 的趋势、风险与重点变更。可通过查看详情进入单独页面查看完整内容。

历史周报:10 当前选择:2026 第 23 周 · 06-01 至 06-07

vLLM 周报:2026 年第 22 周(05/25 - 05/31)

本周 vLLM 团队在 MoE 量化 oracle 模块化重构、ROCm 性能优化、Rust 前端能力增强及 DeepSeek V4 模型深度迭代方面取得显著进展,同时修复大量 bug 并启动废弃流程,整体代码活跃度高,风险变更需持续关注。

2026-05-25 至 2026-05-31 · 来源 PR 199 · 重点 PR 24 · 自动生成 · 生成于 2026-06-01 01:01

查看详情

vllm-project/vllm 2026 年第 21 周周报(05-18 至 05-24)

本周共 224 个 PR 合并,聚焦 DeepSeek V4 模型体系迁移与优化、MoE 量化后端统一模块化、KV 连接器指标与混合注意力支持、Rust 前端正式迁入主线,以及跨平台(CPU/XPU/ROCm)适配加速,同时修复多个性能退化与关键 bug。

2026-05-18 至 2026-05-24 · 来源 PR 224 · 重点 PR 24 · 自动生成 · 生成于 2026-05-25 01:01

查看详情

vllm 2026 第 20 周周报(05-11 至 05-17)

本周聚焦 KV 缓存卸载、MoE 重构与 DeepSeek 模型性能融合,多项实验性功能落地,量化体系整合加速。

2026-05-11 至 2026-05-17 · 来源 PR 216 · 重点 PR 24 · 自动生成 · 生成于 2026-05-18 01:01

查看详情

vLLM 项目 2026 年第 19 周周报(05/04 - 05/10)

本周合并 198 个 PR,重点推进 AutoWeightsLoader 模型迁移、CPU 后端 FP8/GDN 增强、ROCm 融合共享专家与 GDN 优化、推测解码新模型(Cohere EAGLE, Gemma4 MTP)及 Tree Attention 清理,同时 NIXL 与 Mooncake KV 传输体系完成重要重构。

2026-05-04 至 2026-05-10 · 来源 PR 198 · 重点 PR 24 · 自动生成 · 生成于 2026-05-11 01:06

查看详情

vLLM 2026年第18周周报 (04/27 - 05/03)

本周 vLLM 在 DeepSeek V4 完整集成、MLA 注意力后端抽象、ROCm 性能优化、多模态模型扩展及基础设施重构上取得重大进展,代码量显著增长;但新模型测试覆盖和核心路径变更的回归风险仍是关注重点。

2026-04-27 至 2026-05-03 · 来源 PR 174 · 重点 PR 24 · 自动生成 · 生成于 2026-05-04 01:05

查看详情

vllm-project/vllm 2026年第17周周报(04/20 - 04/26)

本周聚焦 MoE 架构系统重构与量化新后端集成,同步推进分布式 KV 传输和推测解码统一化,新增 Hy3、Granite4.1 等模型支持,修复多平台内存泄漏与兼容性问题。

2026-04-20 至 2026-04-26 · 来源 PR 199 · 重点 PR 24 · 自动生成 · 生成于 2026-04-27 01:05

查看详情

2026年第16周周报(04-13 至 04-19)

本周 vLLM 仓库合并 183 个 PR,重点推进量化技术扩展、多模态优化、工具调用健壮性提升和跨平台内核性能,同时核心路径变更风险显著。

2026-04-13 至 2026-04-19 · 来源 PR 183 · 重点 PR 18 · 自动生成 · 生成于 2026-04-20 01:02

查看详情

2026 第 15 周 · 04-06 至 04-12

本周仓库活动以量化基础设施模块化重构、AMD ROCm 平台深度优化以及投机解码性能提升为主线,共计 179 个 PR 中高重要性变更突出,核心路径变更风险需重点关注。

2026-04-06 至 2026-04-12 · 来源 PR 179 · 重点 PR 18 · 自动生成 · 生成于 2026-04-13 01:02

查看详情