Prhub

vllm-project/vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

监控状态:已开启 最近同步:2026-06-04 08:41 同步状态:空闲 下次计划:2026-06-04 09:41

PR 列表

更多筛选
2026-05-30
缺陷修复 重要性 6.21 洞察度 5.00

分离 Phi3V 测试中特殊 token 验证用例

建议接受此 PR。变更清晰、动机明确,且拆分后的测试覆盖更精确。可作为测试分离重构的参考案例。

#38445 [PERF]MiniMax-M2 gate kernel

原始 PR · 作者 jeejeelee · 合并时间 2026-05-30 09:28

性能优化 重要性 9.36 洞察度 7.00

融合 MiniMax-M2 MoE 门控的 FP32 路由 GEMM 核函数

值得精读,展示了如何为特定模型定制融合 GEMM 并通过分层调度集成到现有 MoE 门控框架。重点可关注 `GateLinear.forward` 的四级调度设计和 `fp32_router_gemm_fake` 的注册模式。

#43974 [CI] Fix smoke test step key to bypass block gate

原始 PR · 作者 khluu · 合并时间 2026-05-30 07:28

缺陷修复 重要性 2.59 洞察度 2.00

修复 CI smoke 测试步骤键名使其绕过手动阻塞门

值得合并,修复了之前 PR 引入的 CI 流程问题。CI 维护者可关注是否有其他步骤键名也需按此命名规范调整。

#44023 [CI] Remove duplicate Harmony test coverage

原始 PR · 作者 sfeng33 · 合并时间 2026-05-30 06:52

测试 重要性 5.85 洞察度 2.00

删除重复的 Harmony 测试覆盖

该 PR 已合并,无直接行动项。建议团队将此作为测试清理的范例,定期审查并移除重复或不必要的测试,保持测试套件精简高效。

参与讨论