Repositories / vllm-project / vllm

vllm-project/vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

监控状态：已开启最近同步：2026-06-01 11:28 同步状态：空闲下次计划：2026-06-01 12:28

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-03-31

#38546 [KVConnector] Remove redundant method KVConnectorOutput::merge()

原始 PR · 作者 hickeyma · 合并时间 2026-03-31 12:11

重构重要性 3.00 洞察度 2.00

移除KVConnectorOutput::merge()方法及其辅助函数，清理未用代码。

此PR无需精读，适合作为代码清理的示例。关注点在于如何识别和移除冗余代码，以及review过程中的协作确认。

refactorcleanupkv-connector

#37234 [Bugfix] Fix for builtins (forward fix of pytorch/177558)

原始 PR · 作者 Lucaskabela · 合并时间 2026-03-31 09:08

缺陷修复重要性 5.00 洞察度 6.00

修复PyTorch AOT编译中builtins序列化错误的猴子补丁。

建议工程师阅读此PR以学习条件性猴子补丁的实现和版本守卫策略，特别是_patched_get_runtime_env函数的设计；技术管理者应关注此修复，以规划未来torch版本迁移和移除猴子补丁的时间点。

bugfixtorch.compile

#38265 [Refactor] Consolidate Tool type alias in tool_parsers/utils.py

原始 PR · 作者 sfeng33 · 合并时间 2026-03-31 08:55

重构重要性 3.00 洞察度 5.00

将Tool类型别名统一移至utils.py，简化工具解析模块的类型定义。

对于参与tool-calling模块开发的工程师，建议关注类型别名的设计决策，理解一致性权衡；整体变更较小，可快速浏览以了解代码组织优化。

refactortool-callingcleanup

#36070 [Bugfix][DCP] Fix CUDA graph capture for Decode Context Parallelism

原始 PR · 作者 sungsooha · 合并时间 2026-03-31 08:20

缺陷修复重要性 6.00 洞察度 6.00

修复了Decode Context Parallelism在FULL CUDA图捕获模式下产生错误结果的问题，通过预分配持久化缓冲区确保张量地址稳定。

建议使用DCP和CUDA图的工程师精读此PR，关注张量地址稳定性管理和WorkspaceManager的使用，这些设计决策对类似CUDA图兼容性问题有借鉴价值。

bugfixcudagraph

#38589 Add @vadiklyutiy as committer

原始 PR · 作者 vadiklyutiy · 合并时间 2026-03-31 07:50

基础设施重要性 3.00 洞察度 2.00

在CODEOWNERS文件中添加vadiklyutiy为多个核心模块的代码所有者。

这是一个基础设施维护变更，对于技术管理者，建议检查CODEOWNERS文件以确保所有条目正确，避免配置错误；对于工程师，除非涉及相关模块，否则无需精读，但可关注团队协作模式。

#36466 feat(attention): extract KV-cache update from FlashAttentionDiffKV ba…

原始 PR · 作者 Prathmesh234 · 合并时间 2026-03-31 07:16

重构重要性 5.00 洞察度 5.00

从FlashAttentionDiffKV后端提取KV-cache更新逻辑，提升代码一致性。

建议关注注意力后端设计和vLLM架构的工程师精读此PR，了解如何通过提取方法统一KV-cache更新机制，这是一个典型的重构案例，值得学习以提升代码模块化。

refactorfeature

#38567 Restore non-hf processor path for Nano-Nemotron-VL (bypass `call_hf_processor_mm_only`) - fixes #38018

原始 PR · 作者 netanel-haber · 合并时间 2026-03-31 05:56

缺陷修复重要性 6.00 洞察度 6.00

修复Nano-Nemotron-VL模型多模态处理路径回归，通过重写方法绕过新逻辑。

值得精读以了解多模态处理器路径的设计权衡和耦合风险。关注基类检查机制如何被绕过，以及review中讨论的维护性问题，这对类似模型修复有借鉴意义。

bugfixmodelmulti-modality

#35431 [Bugfix] Use null block (0) for padded block table entries

原始 PR · 作者 SandishKumarHN · 合并时间 2026-03-31 05:02

缺陷修复重要性 6.00 洞察度 6.00

修复 SSM/Mamba 后端中填充块表条目的不一致性，使用块 0 替代 -1 对齐空块约定。

建议 SSM/Mamba 后端开发者精读此 PR，关注填充约定的统一设计决策，如区分 `PAD_SLOT_ID`（用于槽映射）和 `NULL_BLOCK_ID`（用于块表），以及修复 C++ 内核中的潜在索引错误。对于涉及内核优化或 CUDA 图集成的工程师，值得仔细检查变更逻辑以避免回归。

bugfixcudagraphmodel

第 219 / 253 页 · 共 2021 条

上一页 1 … 217 218 219 220 221 … 253 下一页

vllm-project/vllm

PR 列表

#38546 [KVConnector] Remove redundant method KVConnectorOutput::merge()

#37234 [Bugfix] Fix for builtins (forward fix of pytorch/177558)

#38265 [Refactor] Consolidate Tool type alias in tool_parsers/utils.py

#36070 [Bugfix][DCP] Fix CUDA graph capture for Decode Context Parallelism

#38589 Add @vadiklyutiy as committer

#36466 feat(attention): extract KV-cache update from FlashAttentionDiffKV ba…

#38567 Restore non-hf processor path for Nano-Nemotron-VL (bypass `call_hf_processor_mm_only`) - fixes #38018

#35431 [Bugfix] Use null block (0) for padded block table entries

参与讨论