Repositories / vllm-project / vllm

vllm-project/vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

监控状态：已开启最近同步：2026-06-04 04:30 同步状态：空闲下次计划：2026-06-04 05:30

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-06-04

#42453 [Feature] Support batch invariant rms norm with residual

原始 PR · 作者 yewentao256 · 合并时间 2026-06-04 03:22

重构重要性 7.28 洞察度 5.00

融合residual支持到batch-invariant RMS norm

值得精读，特别是关于批处理不变性归一化的设计模式。合并函数并支持可选residual的做法简洁清晰，可作为类似重构的参考。

refactorv1cleanup

#44429 [Model] Add Gemma4 Unified (encoder-free) support

原始 PR · 作者 lucianommartins · 合并时间 2026-06-04 03:01

功能重要性 9.18 洞察度 5.00

新增 Gemma4 Unified 编码器无关多模态模型

值得精读，特别关注子类化父类避免分支的设计模式，以及量化条件处理和嵌入数据类型的讨论。后续需要跟进 PR#44340 的修复并验证音频回归。

featuremodelv1

#44413 [LoRA] Fix dedup for post-replacement module aliases

原始 PR · 作者 linitra24 · 合并时间 2026-06-04 02:23

缺陷修复重要性 4.55 洞察度 4.00

修复后替换别名路径的 LoRA 去重遗漏

值得合并，修复了明确的回归场景。可作为学习 LoRA 模块包装机制的典型示例。

bugfixloramodel

#44122 [Refactor] Remove dead code fp quant

原始 PR · 作者 yewentao256 · 合并时间 2026-06-04 02:22

重构重要性 6.06 洞察度 2.00

移除 FPQuant 中的死代码

建议合并，属于常规代码清理，无技术风险，有助于保持代码库整洁。

refactorcleanupquantization

#44370 [ROCm][CI] Move Model Executor test step from MI250 to MI300 (gfx942)

原始 PR · 作者 JartX · 合并时间 2026-06-04 01:23

基础设施重要性 4.46 洞察度 5.00

将 Model Executor CI 步骤从 MI250 迁移至 MI300

值得关注：这是一个典型的“硬件代际迁移”操作，展示了在 CI 中如何因硬件能力差异（FP8 支持）而调整测试分配，对维护多硬件 CI 的团队有参考价值。

rocmci/buildci

#44365 [10b/n] Migrate custom all-reduce, DeepSeek V4 fused MLA, MiniMax reduce-RMS, and MXFP8 MoE to libtorch stable ABI

原始 PR · 作者 cleonard530 · 合并时间 2026-06-04 00:29

重构重要性 7.03 洞察度 6.00

迁移四组 CUDA 内核到 libtorch stable ABI

值得精读，特别是 stable ABI 适配的模式（如使用 STD_TORCH_CHECK、STABLE_TORCH_LIBRARY_FRAGMENT 和 TORCH_BOX 宏）。对于贡献者，了解这些模式有助于参与后续迁移步骤。设计上保留 ROCm 专用 QuickReduce 在 legacy 是一个透明决策，需关注后续迁移计划。

refactordeepseeknvidia

#43659 Handle spinloop ext load failure gracefully

原始 PR · 作者 pschlan-amd · 合并时间 2026-06-04 00:09

缺陷修复重要性 4.62 洞察度 3.00

优雅处理 spinloop 扩展加载失败

简单且必要的健壮性改进，值得快速合并。日志系统使用的规范值得其他开发者参考。

bugfixinfraci/build

#44207 fix(config): validate max_num_scheduled_tokens >= 0 on all paths

原始 PR · 作者 Oxygen56 · 合并时间 2026-06-04 00:06

缺陷修复重要性 4.92 洞察度 4.00

修复负值 max_num_scheduled_tokens 绕过验证的 bug

这是一个清晰的低风险修复，值得合并。虽为微小改动，但体现了配置验证一致性的好实践——避免将验证逻辑分散在条件分支中。建议在类似场景（如 `max_num_seqs` 等字段）也应用相同模式。

bugfixv1scheduler

第 1 / 268 页 · 共 2143 条

1 2 3 4 5 … 268 下一页