Prhub

vllm-project/vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

监控状态:已开启 最近同步:2026-06-14 09:17 同步状态:空闲 下次计划:2026-06-14 10:17

PR 列表

更多筛选
2026-03-26

#38207 [CI] Reorganize scoring tests

原始 PR · 作者 noooop · 合并时间 2026-03-26 20:07

测试 重要性 5.00 洞察度 4.00

重组评分测试,优化测试结构并新增覆盖,修复任务误用问题。

建议技术管理者和工程师关注测试重组的设计决策,如按模型类型(bi-encoder、cross-encoder、late interaction)分类测试,以及review中指出的测试正确性问题。此PR值得精读,以了解如何结构化大型测试套件、避免常见测试陷阱(如任务误用、死代码),并参考错误消息的调整实践。

缺陷修复 重要性 4.00 洞察度 5.00

修复 ROCm 平台 GPTQ 编译正确性测试的 flaky 行为,通过零初始化整数参数并纠正测试逻辑。

建议工程师精读此 PR,以学习 ROCm 与 CUDA 在内存初始化方面的平台差异,以及如何编写健壮的跨平台测试;特别关注 `initialize_single_dummy_weight` 中的条件逻辑,它展示了处理平台特定行为的设计决策。

#38153 [Refactor] Remove unused utils

原始 PR · 作者 yewentao256 · 合并时间 2026-03-26 17:08

重构 重要性 4.00 洞察度 2.00

移除三个未使用的工具函数及其测试,清理代码库。

建议技术管理者简要审阅此 PR,关注 review 中提到的 `wraps` 导入问题,确保已正确处理。对于工程师,此 PR 是简单的清理操作,无需深入精读,但可作为代码维护的参考案例。

#38125 DOC: Documentation pages fixes

原始 PR · 作者 mtsokol · 合并时间 2026-03-26 16:55

文档 重要性 2.00 洞察度 2.00

修复配置文件docstring中的表格格式,提升文档渲染质量。

此PR为纯文档修复,无需精读;但可关注mkdocstrings的交叉引用机制和--help输出的处理方式,以理解文档工具链的工作细节。

#38193 [XPU] Disable xpu graph by default

原始 PR · 作者 jikunshang · 合并时间 2026-03-26 16:53

重构 重要性 5.00 洞察度 3.00

禁用 XPU graph 默认启用,添加环境变量控制。

PR 变更简单,值得快速 review,关注环境变量添加和默认行为更改,对 XPU 用户重要,建议确保文档更新以通知用户新配置。

文档 重要性 1.00 洞察度 2.00

修复文档中 EncoderCudaGraphManager 的引用路径,解决文档构建失败。

这是一个简单的文档修复,无需精读。建议团队在类似重构后及时更新文档引用,以避免构建中断。

功能 重要性 6.00 洞察度 5.00

为多模态处理器引入助手函数,避免在 token-only 输入时生成虚拟文本。

建议团队精读此 PR,重点关注 `call_hf_processor_mm_only` 的设计决策,以及各模型特定重写(如 pixtral.py 中的 batch 维度处理)的逻辑,以理解多模态输入处理的最佳实践和潜在风险。

参与讨论