Prhub

vllm-project/vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

监控状态:已开启 最近同步:2026-06-04 07:39 同步状态:空闲 下次计划:2026-06-04 08:39

PR 列表

更多筛选
2026-06-03
重构 重要性 3.94 洞察度 2.00

移除 cudagraph_utils 中冗余的 graph_pool 赋值

该 PR 是简单的清理工作,不值得精读。但值得关注的设计决策:BreakableCUDAGraphWrapper 统一通过 current_platform.get_global_graph_pool() 获取 pool,符合单一职责原则。

基础设施 重要性 3.29 洞察度 1.00

升级 actions/github-script from v8 to v9

建议合并后观察 CI 状态,无需深入审查代码。若后续 workflow 脚本需要调用 getOctokit,可参考 v9 文档。

功能 重要性 6.71 洞察度 5.00

MRV2 支持 Llama 与 Mistral 密集模型

建议在合并后密切监控 Llama/Mistral 相关测试的稳定性,并优先处理 force_v1_runner 的环境变量覆盖问题。该 PR 值得精读,展示了 MRV2 激活的标准流程测试适配模式。

功能 重要性 7.09 洞察度 4.00

支持 Anthropic messages 数组内联 system 角色

该 PR 解决了一个实际的客户端兼容性问题,实现简洁且测试充分,推荐合并。设计上值得关注的点是:通过先收集再合并的方式处理两处 system 信息来源,而不是分别追加,避免消息顺序错误。

#43339 [Feature] Support EPLB for DeepSeek v4 Mega Moe

原始 PR · 作者 wzhao18 · 合并时间 2026-06-03 01:56

功能 重要性 8.58 洞察度 6.00

为DeepSeek V4 Mega MoE添加EPLB负载均衡支持

建议在合并前修复PP模式下断言失败的问题。PR的设计(重用现有映射函数、明确环境变量覆盖条件)值得肯定。后续可增加针对PP模式和不同EPLB后端的测试。对于使用DeepSeek V4 Mega MoE的团队,此PR能显著提升大规模部署效率,推荐评估并合入。

#43100 [BugFix] Fix Humming MoE deploy error

原始 PR · 作者 adotdad · 合并时间 2026-06-03 00:32

缺陷修复 重要性 5.32 洞察度 3.00

修复 Humming MoE 部署时 quant config 与 schema 初始化遗漏

建议合并。该 PR 修复了明确的部署阻塞 bug,改动量小且经过本地验证。建议后续为该路径补充测试,防止回归。

参与讨论