Repositories / vllm-project / vllm

vllm-project/vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

监控状态：已开启最近同步：2026-06-04 08:41 同步状态：空闲下次计划：2026-06-04 09:41

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-06-02

#44265 [ROCm] Upgrade AITER to v0.1.13.post1

原始 PR · 作者 micah-wil · 合并时间 2026-06-02 09:49

基础设施重要性 2.42 洞察度 1.00

升级 AITER 到 v0.1.13.post1

建议快速合并此 PR。变更简单且已通过 CI 验证，只需确认升级后的 AITER 版本与现有代码兼容。

rocmci/buildinfra

#43742 [Bugfix][Mooncake] Release GPU pin on failed store in MooncakeStoreConnector

原始 PR · 作者 Dao007forever · 合并时间 2026-06-02 09:29

缺陷修复重要性 7.27 洞察度 5.00

修复 Mooncake 存储失败时 GPU pin 未释放的 bug

值得合并。修复了内存泄漏 bug，逻辑正确，测试充足。可以快速合入。

bugfixkv-connectorv1

#44262 [DSV4] Refactor RoPE initialization

原始 PR · 作者 WoosukKwon · 合并时间 2026-06-02 09:26

重构重要性 7.13 洞察度 4.00

提取 DeepSeek-V4 RoPE 初始化逻辑为公共函数

该 PR 值得精读，因为它展示了如何通过提取公共函数消除跨平台代码重复。对于维护 DeepSeek-V4 模型的工程师，建议理解 `build_deepseek_v4_rope` 中封装的所有参数处理逻辑，以便未来修改时确保一致性。

refactorcleanupmodel

#44256 [ROCm][CI] Skip unbacked dynamic shapes tests on PyTorch < 2.11

原始 PR · 作者 JartX · 合并时间 2026-06-02 08:09

缺陷修复重要性 3.80 洞察度 2.00

跳过 PyTorch<2.11 时的 unbacked dynamic shapes 测试

该 PR 属于小范围 CI 修复，无需精读。但注释中关于 `shape_id` 和 `mark_unbacked` 的说明对理解 dynamic shapes 的版本依赖有一定价值。

rocmcibugfix

#44246 [DSV4] Remove unncessary classes & functions

原始 PR · 作者 WoosukKwon · 合并时间 2026-06-02 05:43

重构重要性 7.89 洞察度 3.00

移除 DeepseekV4 中无用的包装类和数据结构

值得合并，因为它清除了无用的抽象层，降低了后续维护成本。虽然没有功能变化，但类似的清理有助于保持代码健康。对于阅读者，可以从中学习到如何通过消除不必要的包装来简化代码结构。

refactorcleanupmodel

#44234 [Test][BugFix] Fix double-BOS in PD+specdec acceptance test

原始 PR · 作者 njhill · 合并时间 2026-06-02 05:31

缺陷修复重要性 3.64 洞察度 2.00

修复 PD+SD 测试中重复 BOS 问题

建议合并。修复虽小但提升了测试质量，防止未来因 token 不一致导致的误判。

bugfixtestv1

#44248 [BugFix][CI] Fix added `_has_module` tests

原始 PR · 作者 njhill · 合并时间 2026-06-02 05:23

缺陷修复重要性 5.39 洞察度 2.00

修复 _has_module 测试用例覆盖范围

本 PR 是简单的测试修复，技术价值较低，但反映了合入流程中测试未同步更新的问题。建议团队在快速合入时确保测试与实现一致，可考虑增加合入检查步骤。

bugfixtestcleanup

#40096 [Frontend][Core] Add sparse NCCL weight transfer support for in-place updates

原始 PR · 作者 bedeks · 合并时间 2026-06-02 03:37

功能重要性 9.18 洞察度 6.00

添加稀疏 NCCL 权重传输支持

值得精读：PR 展示了在复杂分布式模块中增量添加新传输模式的典型方法——数据契约优先（`SparseWeightPatch` 与 `update_kind`）、基类抽象与后端实现分离、性能敏感度（GPU-CPU 同步取舍）。适合希望理解 vLLM 权重传输架构或计划实现类似稀疏方案的开发者。

featurev1performance

第 14 / 269 页 · 共 2148 条

上一页 1 … 12 13 14 15 16 … 269 下一页