Repositories / vllm-project / vllm

vllm-project/vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

监控状态：已开启最近同步：2026-05-31 06:35 同步状态：空闲下次计划：2026-05-31 07:35

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-03-25

#36869 [KVTransfer][Mooncake] Add heterogeneous TP support for disaggregated P/D in MooncakeConnector

原始 PR · 作者 JianDan0212 · 合并时间 2026-03-25 21:24

功能重要性 6.00 洞察度 7.00

为 Mooncake KV 连接器添加异构张量并行支持，以启用非对称预填充/解码部署。

建议技术管理者和工程师精读此 PR，重点关注 _compute_sender_transfer_plan 函数的异构 TP 传输规划逻辑和区域合并策略。review 讨论中的设计权衡（如重用现有 utils 的决策）值得学习，有助于理解 KV 传输后端演进。

featurekv-connectorrefactor

#37902 [Mypy] Better fixes for the `mypy` issues in `vllm/config`

原始 PR · 作者 hmellor · 合并时间 2026-03-25 21:14

重构重要性 5.00 洞察度 6.00

优化vLLM配置模块的mypy类型检查，并新增LLM.from_engine_args方法以简化引擎参数处理。

建议工程师精读此PR，重点关注设计决策如使用`# type: ignore[assignment]`来指定运行时默认值，以及`LLM.from_engine_args`方法如何优雅地避免递归转换。这些模式在处理复杂配置时值得借鉴。

refactorperformancedocumentation

#37607 [CPU][UX][Perf] Enable tcmalloc by default

原始 PR · 作者 fadara01 · 合并时间 2026-03-25 20:39

性能优化重要性 6.00 洞察度 5.00

为 CPU 平台默认启用 tcmalloc 以提升开箱即用性能。

建议技术管理者关注此 PR 如何通过动态库管理和构建时优化提升 CPU 性能；工程师可学习其自动资源捆绑和运行时环境配置模式，适用于类似性能优化场景。

cpuperformance

#38074 [Model] Add AutoWeightsLoader support for jais

原始 PR · 作者 grYe99 · 合并时间 2026-03-25 20:38

功能重要性 5.00 洞察度 5.00

为 JAIS 模型添加 load_weights 方法并重构以支持 AutoWeightsLoader，提升一致性。

建议阅读者精读此 PR，以了解如何集成 AutoWeightsLoader 并处理自定义权重逻辑。关注设计决策，如为何保留部分自定义代码而非完全使用 AutoWeightsLoader，这对模型加载模块的设计有参考价值。

jaismodelrefactor

#38090 Fix Plamo 2/3 & LFM2 for Transformers v5

原始 PR · 作者 hmellor · 合并时间 2026-03-25 20:29

缺陷修复重要性 5.00 洞察度 4.00

修复 Plamo 2/3 和 LFM2 模型以兼容 Transformers v5 的配置变更。

对于 vLLM 维护者或使用 Plamo/LFM2 模型的工程师，建议快速 review 此 PR 以理解兼容性变更。变更逻辑简单，但涉及核心模型参数，值得关注以确保无遗漏。对于学习模型适配模式的开发者，可精读类型检查改进部分。

bugfixmodelrefactor

#38035 Better weight tying check for multimodal models

原始 PR · 作者 hmellor · 合并时间 2026-03-25 20:07

缺陷修复重要性 4.00 洞察度 4.00

改进多模态模型中 `tie_word_embeddings` 的检查逻辑，避免误判。

对于处理多模态模型或 Transformers v5 兼容性的开发者，建议精读此 PR 以了解权重绑定逻辑的设计权衡；对于一般用户，变更影响有限，可快速浏览。

bugfixmodelmulti-modality

#38102 [ROCm][CI] Rename filepath test to point to correct file

原始 PR · 作者 AndreasKaratzas · 合并时间 2026-03-25 20:05

缺陷修复重要性 2.00 洞察度 1.00

修正 ROCm CI 配置中测试文件路径的拼写错误，确保测试正确执行。

该 PR 变更琐碎，不值得精读；但可作为 CI 配置修正的参考，或提醒在类似文件中检查拼写错误。

rocmcibugfix

#37840 [Docs] Adds vllm-musa to custom_op.md

原始 PR · 作者 yeahdongcn · 合并时间 2026-03-25 19:54

文档重要性 1.00 洞察度 1.00

在 custom_op.md 文档中添加 vllm-musa 插件信息。

此 PR 变更简单，无需精读。可作为文档更新的标准示例。关注点在于确保外部链接的有效性和文档一致性，对于深入了解硬件插件机制的工程师，可参考相关设计文档。

documentation

第 237 / 253 页 · 共 2019 条

上一页 1 … 235 236 237 238 239 … 253 下一页