Repositories / vllm-project / vllm

vllm-project/vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

监控状态：已开启最近同步：2026-06-13 21:47 同步状态：空闲下次计划：2026-06-13 22:47

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-06-02

#38053 [BugFix] Fix TypeError in MiniCPM-O audio feature unpadding

原始 PR · 作者 Krishnachaitanyakc · 合并时间 2026-06-02 10:57

缺陷修复重要性 7.24 洞察度 5.00

修复MiniCPM-O音频特征长度类型错误和多块对齐

该PR值得阅读，特别是多模态数据处理中字段配置的动态调整技巧。设计决策包括使用 flatten().tolist() 处理张量通用展平，以及用 flat 字段配置替换 batched 来解决多块对齐问题。对于其他可能遇到类似对齐问题的模型有参考价值。

bugfixmodelmulti-modality

#44131 [CI] Stabilize OpenAI schema fuzzing for malformed structural tags

原始 PR · 作者 AndreasKaratzas · 合并时间 2026-06-02 10:56

缺陷修复重要性 8.11 洞察度 4.00

在API层提前校验structural_tag格式

推荐阅读，特别是 `validate_structural_tag_response_format` 的实现，展示了一种将深层引擎错误转化为 API 层校验错误的模式，有助于保持 API 的错误分类清晰。

bugfixfrontendtool-calling

#44017 [Refactor] Move unstreamed tool-arg flush from serving layer to parser

原始 PR · 作者 sfeng33 · 合并时间 2026-06-02 10:37

重构重要性 8.07 洞察度 5.00

将未流式化的工具参数冲刷从 serving 层移到 parser

值得精读，特别是对 tool-calling 流式和 parser 架构感兴趣的同学。设计上的核心决策——将冲刷逻辑从 serving 层下沉到 parser——是典型的状态内聚重构范例，值得学习。合并方式选择了 merge-only 而非 standalone 分支，体现了避免丢失字段的权衡。同时，测试的迁移方式也为类似重构提供了参考。

frontendtool-callingrefactor

#44266 [Bugfix][CI] Normalize NIXL connector CUDA wheel installs

原始 PR · 作者 alec-flowers · 合并时间 2026-06-02 10:34

缺陷修复重要性 4.36 洞察度 3.00

修复 CI 中 NIXL 连接器 CUDA wheels 安装

值得快速合并，修复明确的 CI bug。建议后续关注：若出现新的 CUDA 版本（如 cu14），需更新脚本；也可考虑将 CUDA 版本检测逻辑放入共享的 CI 基础镜像中。

bugfixci/buildkv-connector

#44265 [ROCm] Upgrade AITER to v0.1.13.post1

原始 PR · 作者 micah-wil · 合并时间 2026-06-02 09:49

基础设施重要性 2.42 洞察度 1.00

升级 AITER 到 v0.1.13.post1

建议快速合并此 PR。变更简单且已通过 CI 验证，只需确认升级后的 AITER 版本与现有代码兼容。

rocmci/buildinfra

#43742 [Bugfix][Mooncake] Release GPU pin on failed store in MooncakeStoreConnector

原始 PR · 作者 Dao007forever · 合并时间 2026-06-02 09:29

缺陷修复重要性 7.27 洞察度 5.00

修复 Mooncake 存储失败时 GPU pin 未释放的 bug

值得合并。修复了内存泄漏 bug，逻辑正确，测试充足。可以快速合入。

bugfixkv-connectorv1

#44262 [DSV4] Refactor RoPE initialization

原始 PR · 作者 WoosukKwon · 合并时间 2026-06-02 09:26

重构重要性 7.13 洞察度 4.00

提取 DeepSeek-V4 RoPE 初始化逻辑为公共函数

该 PR 值得精读，因为它展示了如何通过提取公共函数消除跨平台代码重复。对于维护 DeepSeek-V4 模型的工程师，建议理解 `build_deepseek_v4_rope` 中封装的所有参数处理逻辑，以便未来修改时确保一致性。

refactorcleanupmodel

#44256 [ROCm][CI] Skip unbacked dynamic shapes tests on PyTorch < 2.11

原始 PR · 作者 JartX · 合并时间 2026-06-02 08:09

缺陷修复重要性 3.80 洞察度 2.00

跳过 PyTorch<2.11 时的 unbacked dynamic shapes 测试

该 PR 属于小范围 CI 修复，无需精读。但注释中关于 `shape_id` 和 `mark_unbacked` 的说明对理解 dynamic shapes 的版本依赖有一定价值。

rocmcibugfix

第 57 / 312 页 · 共 2496 条

上一页 1 … 55 56 57 58 59 … 312 下一页