Repositories / vllm-project / vllm

vllm-project/vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

监控状态：已开启最近同步：2026-05-31 04:32 同步状态：空闲下次计划：2026-05-31 05:32

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-04-24

#40688 [Deprecate] Deprecate LLM.reward offline api, use LLM.encode instead.

原始 PR · 作者 noooop · 合并时间 2026-04-24 13:37

重构重要性 8.21 洞察度 5.00

弃用 LLM.reward 离线 API，推荐使用 LLM.encode 替代

建议阅读 PR 的开发者关注文档更新和示例，以理解 pooling 任务的正确使用；同时监控下游代码是否使用 `LLM.reward`，以便在 v0.23 移除前完成迁移。

frontenddocumentationrefactor

#40713 [Bugfix] Avoid mutating `chat_template_kwargs` in `HYV3ReasoningParser` initialization

原始 PR · 作者 BugenZhao · 合并时间 2026-04-24 13:08

缺陷修复重要性 5.72 洞察度 4.00

修复 HYV3ReasoningParser 初始化时变输入参数字典的问题

该 PR 值得精读，尤其是 reasoning parser 构造函数的模式设计——函数不应修改传入的可变对象。建议团队在类似场景中统一使用 `.get()` 而非 `.pop()`。

bugfixhy_v3reasoning

#40427 [Platform] Fix RISC-V platform detection (lscpu parsing + non-NUMA meminfo)

原始 PR · 作者 lyd1992 · 合并时间 2026-04-24 12:33

缺陷修复重要性 6.20 洞察度 4.00

修复 RISC-V 平台检测与 lscpu 解析问题

值得精读的部分：`_get_cpu_list()` 中 lscpu 输出的正则处理策略，以及如何优雅地处理不完全的拓扑信息。建议关注 `_synthesize_cpu_list` 的引入位置，它为后续可能出现的其他弱拓扑平台提供了复用基础。

bugfixcpuriscv

#40043 [Feature] Avoid eager import of the "mistral_common" package.

原始 PR · 作者 nascheme · 合并时间 2026-04-24 10:49

功能重要性 6.69 洞察度 6.00

懒加载 mistral_common 包，避免非 Mistral 场景下的过早导入

值得精读，展示了如何通过 `LazyLoader` + 类属性标记实现条件懒加载，避免大型依赖包过早导入。设计模式清晰，可作团队内部最佳实践参考。

frontendtool-callingmistral

#40729 [Doc] fix capitalization consistency in README (vLLM, Hugging Face)

原始 PR · 作者 VinayakMishra95 · 合并时间 2026-04-24 10:23

文档重要性 1.36 洞察度 0.50

修正 README 中 vLLM 和 Hugging Face 的大小写

可直接合并。此 PR 为清洁的文档修正，无技术含量，但体现了对细节的关注，适合快速合入。

documentationcleanup

#40746 [MRV2] Ensure warmup covers prefill path

原始 PR · 作者 njhill · 合并时间 2026-04-24 09:33

缺陷修复重要性 5.86 洞察度 5.00

修复预填充预热批次被误分类为解码批次的问题

值得精读。虽然变更代码量很小（+9/-6），但修复了一个仅在特定条件下触发的关键路径误分类问题，体现了对MRV2架构细节的深入理解。推荐关注设计决策：通过增加预热prompt长度来确保查询长度差异，这是一种简洁且非侵入式的修复方案。

bugfixspeculative-decoding

#40059 [BUG]: fix HF tokenizer concurrent borrow in tool parsers

原始 PR · 作者 yzong-rh · 合并时间 2026-04-24 09:20

缺陷修复重要性 6.70 洞察度 6.00

替换 tokenizer.encode/decode 为 vocab 查找修复并发借用

值得精读。展示了如何通过消除共享可变状态而非加锁来解决并发问题，方法简洁高效。关注的重点：利用 tokenizer 内部已缓存的 vocabl（线程安全）替代 encode 调用，这是典型的“移走而非保护”策略。

bugfixtool-callingllama

#36700 [Misc] Added curl retries in install_python_libraries.sh

原始 PR · 作者 dmitry-tokarev-nv · 合并时间 2026-04-24 09:19

其他重要性 2.16 洞察度 2.00

curl 下载添加重试机制提升脚本可靠性

简单但有效的可靠性改进，值得合入。可关注 CI 日志确认重试是否成功。

ci/build

第 133 / 253 页 · 共 2019 条

上一页 1 … 131 132 133 134 135 … 253 下一页