Repositories / vllm-project / vllm

vllm-project/vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

监控状态：已开启最近同步：2026-06-01 12:31 同步状态：空闲下次计划：2026-06-01 13:31

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-04-01

#38722 [Misc] Fix docstring typo: buildin -> builtin

原始 PR · 作者 crawfordxx · 合并时间 2026-04-01 22:39

其他重要性 1.00 洞察度 1.00

修复harmony_utils.py中has_custom_tools函数文档字符串的拼写错误。

这是一个简单的文档修正，无需深入阅读。对于希望了解MCP工具分类机制的开发者，可以关注has_custom_tools函数的实现逻辑，但本次变更本身不包含值得关注的设计决策。

frontendcleanupdocumentation

#38723 Fix shape comment in extract_hidden_states example

原始 PR · 作者 fynnsu · 合并时间 2026-04-01 22:29

文档重要性 1.00 洞察度 1.00

修复提取隐藏状态示例中的形状注释错误。

该PR无需精读，除非您特别关注示例文档的准确性。变更简单明了，没有值得关注的设计决策。

documentationcleanupfrontend

#35153 [MoE Refactor] Make SharedExperts class for use with DefaultMoERunner

原始 PR · 作者 bnellnm · 合并时间 2026-04-01 21:44

重构重要性 9.36 洞察度 7.00

引入 SharedExperts 类集中管理 MoE 共享专家执行，重构核心运行器。

建议深入阅读 SharedExperts 类的实现，理解其如何决策执行顺序和处理流同步；关注 DefaultMoERunner 中 forward_dispatch 的设计，这是整合新类的关键；同时，注意 review 中提及的待优化点，如所有权动态化，以把握未来演进方向。

refactormoe

#38359 [Bugfix] Revert "Zero-init MLA attention output buffers to prevent NaN from CUDA graph padding"

原始 PR · 作者 elvircrn · 合并时间 2026-04-01 21:11

缺陷修复重要性 4.00 洞察度 5.00

回滚MLA注意力输出缓冲区的零初始化，移除CUDA图填充导致的性能开销和FlashInfer兼容性hack。

建议关注此PR作为代码清理和问题根源澄清的案例。值得精读以理解：1) 为何零初始化方案被判定为多余；2) 如何正确处理CUDA图填充与NaN问题；3) FlashInfer兼容性hack的移除方式。

bugfixrefactorperformance

#37831 [Bugfix] Fix Qwen3CoderToolParser anyOf/oneOf type resolution for nullable params

原始 PR · 作者 AAISSJ · 合并时间 2026-04-01 20:22

缺陷修复重要性 6.00 洞察度 6.00

修复Qwen3CoderToolParser中anyOf/oneOf参数类型解析错误，确保可为空参数正确转换。

建议工程师阅读此PR以了解JSON Schema类型解析的设计决策，特别是对于Nullable参数和$ref的优雅处理。代码重构展示了如何将复杂条件逻辑模块化为辅助方法，值得在类似类型处理场景中借鉴。

bugfixtool-callingqwen

#38179 [KVTransfer] Fix TpKVTopology.is_kv_replicated equality case

原始 PR · 作者 JianDan0212 · 合并时间 2026-04-01 18:41

缺陷修复重要性 4.00 洞察度 3.00

修复KV缓存复制判断中的边界条件，确保TP规模等于KV头数时不误判为复制。

建议KV连接器和分布式相关开发者精读此PR，虽然变更只有一行，但揭示了KV缓存复制判断的重要边界条件。特别关注Copilot关于添加单元测试的建议，这是防止未来回归的关键。

kv-connectorbugfix

#38636 (security) Enforce frame limit in VideoMediaIO

原始 PR · 作者 jperezdealgaba · 合并时间 2026-04-01 18:23

缺陷修复重要性 6.00 洞察度 5.00

在 VideoMediaIO 中强制实施帧数限制，防止 base64 JPEG 视频导致的内存耗尽漏洞。

建议精读此 PR，重点关注 load_base64 方法中如何处理 num_frames 边界条件的设计决策，以及安全漏洞修复的代码实现，可作为多模态输入验证的参考案例。

securitymulti-modalitybugfix

#38708 Add `verified` label to trigger `pre-commit`

原始 PR · 作者 hmellor · 合并时间 2026-04-01 17:31

基础设施重要性 3.00 洞察度 2.00

添加`verified`标签以仅触发pre-commit检查，不触发测试。

该PR属于小型基础设施改动，对于CI维护者和贡献者了解新标签机制可能值得关注，但对于一般工程师，无需精读，除非涉及GitHub Actions配置优化。

第 211 / 253 页 · 共 2022 条

上一页 1 … 209 210 211 212 213 … 253 下一页