Repositories / vllm-project / vllm

vllm-project/vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

监控状态：已开启最近同步：2026-06-14 02:56 同步状态：空闲下次计划：2026-06-14 03:56

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-03-25

#38012 [BugFix] Fix order of compile logging

原始 PR · 作者 zou3519 · 合并时间 2026-03-25 02:58

缺陷修复重要性 3.00 洞察度 2.00

修复 AOT 编译加载日志顺序，确保计数和日志只在缓存命中时更新。

这是一个小范围的 bugfix，代码变更简单明了，建议快速 review 并合并。对于工程师，可关注日志顺序调整的设计，但无需深度精读，除非涉及编译系统调试。

bugfixtorch.compilerefactor

#38019 [Model] Add Granite 4.0 1B speech to supported models

原始 PR · 作者 NickCao · 合并时间 2026-03-25 02:23

功能重要性 6.00 洞察度 4.00

添加 Granite 4.0 1B speech 模型到 vLLM 支持列表，并提供测试覆盖。

建议工程师阅读此 PR 以了解如何在 vLLM 中添加新模型，特别是测试适配和文档更新模式。但变更相对简单，无需深度研究；可关注语言列表的潜在风险，考虑未来动态验证改进。

modeltestdocumentation

#37706 [Bugfix] Fix structured output crash on CPU due to pin_memory=True

原始 PR · 作者 wjhrdy · 合并时间 2026-03-25 01:44

缺陷修复重要性 6.00 洞察度 6.00

修复CPU部署中结构化输出因pin_memory=True导致的崩溃。

对于涉及CPU部署或结构化输出功能的工程师，推荐阅读此PR以理解设备检测和内存优化的最佳实践；对技术管理者，可关注代码审查过程中的设计权衡如何提升代码质量。

bugfixcpustructured-output

#37998 docs: fix broken offline inference paths in documentation

原始 PR · 作者 vineetatiwari27 · 合并时间 2026-03-25 01:35

文档重要性 2.00 洞察度 2.00

修复 pooling 模型文档中离线推理示例的路径错误。

这是一个简单的文档修复 PR，无需深入技术分析。值得关注的是验证过程和范围控制，以体现维护者审慎处理文档变更的态度。对于工程师，可以快速浏览以了解如何修正路径错误，并检查是否有类似问题在其他文档中。

documentation

#37728 Fix Mamba state corruption from referencing stale block table entries (#37728) (#37728)

原始 PR · 作者 minosfuture · 合并时间 2026-03-25 01:30

缺陷修复重要性 6.00 洞察度 5.00

修复Mamba状态损坏，清除陈旧block table条目。

建议工程师精读此PR，特别是block_table.py的clear_row实现和gpu_model_runner.py的_dummy_run同步逻辑，以理解DP和CUDA图中状态管理的设计权衡。

bugfixcudagraph

#37923 [Bugfix] Force continuous usage stats when CLI override is enabled

原始 PR · 作者 dsingal0 · 合并时间 2026-03-25 01:29

缺陷修复重要性 4.00 洞察度 3.00

修复CLI强制使用统计标志未启用连续使用统计的bug。

建议快速浏览以理解修复逻辑，特别是`should_include_usage()`函数的变更。对于负责entrypoints模块或前端测试的工程师，值得关注回归测试的设计，以确保覆盖所有相关场景。

bugfixfrontendtest

#37964 [XPU] Support Intel XPU hardware information collection in usage stats

原始 PR · 作者 1643661061leo · 合并时间 2026-03-25 01:29

缺陷修复重要性 4.00 洞察度 3.00

在 usage stats 中添加 Intel XPU 硬件信息收集，避免 gpu_type 和 gpu_count 为 null。

该 PR 值得 XPU 用户或 usage stats 模块维护者精读，以了解硬件检测扩展模式。建议关注 review 中提到的设备数检查缺失问题，在部署到无 XPU 设备的环境时可能引发异常。

bugfixxpu

#37904 [Mypy] Fix mypy for `vllm/model_executor` (except `vllm/model_executor/layers`)

原始 PR · 作者 hmellor · 合并时间 2026-03-25 01:14

重构重要性 4.00 洞察度 4.00

修复vllm/model_executor模块的mypy类型错误，提升代码质量。

对于从事vllm/model_executor模块开发或类型检查工作的工程师，此PR值得精读，可以关注如何通过类型提示、断言和cast提升代码安全性，特别是在处理复杂类型时的设计决策。

refactortest

第 301 / 313 页 · 共 2497 条

上一页 1 … 299 300 301 302 303 … 313 下一页