#38167 [ROCm][CI] Fix wvSplitKrc mock argument order in test_rocm_unquantized_gemm
作者 AndreasKaratzas · 合并时间 2026-03-26 19:55
修复ROCm测试中wvSplitKrc mock的参数顺序错误,确保CI通过。
该PR变更简单,无需精读。值得快速查看以了解测试mock的使用方式和参数顺序敏感性的处理,但无复杂设计决策。
A high-throughput and memory-efficient inference and serving engine for LLMs
作者 AndreasKaratzas · 合并时间 2026-03-26 19:55
修复ROCm测试中wvSplitKrc mock的参数顺序错误,确保CI通过。
该PR变更简单,无需精读。值得快速查看以了解测试mock的使用方式和参数顺序敏感性的处理,但无复杂设计决策。
作者 yewentao256 · 合并时间 2026-03-26 17:08
移除三个未使用的工具函数及其测试,清理代码库。
建议技术管理者简要审阅此 PR,关注 review 中提到的 `wraps` 导入问题,确保已正确处理。对于工程师,此 PR 是简单的清理操作,无需深入精读,但可作为代码维护的参考案例。
作者 mtsokol · 合并时间 2026-03-26 16:55
修复配置文件docstring中的表格格式,提升文档渲染质量。
此PR为纯文档修复,无需精读;但可关注mkdocstrings的交叉引用机制和--help输出的处理方式,以理解文档工具链的工作细节。
作者 jikunshang · 合并时间 2026-03-26 16:53
禁用 XPU graph 默认启用,添加环境变量控制。
PR 变更简单,值得快速 review,关注环境变量添加和默认行为更改,对 XPU 用户重要,建议确保文档更新以通知用户新配置。
作者 DarkLight1337 · 合并时间 2026-03-26 16:52
修复文档中 EncoderCudaGraphManager 的引用路径,解决文档构建失败。
这是一个简单的文档修复,无需精读。建议团队在类似重构后及时更新文档引用,以避免构建中断。
作者 DarkLight1337 · 合并时间 2026-03-26 16:44
为多模态处理器引入助手函数,避免在 token-only 输入时生成虚拟文本。
建议团队精读此 PR,重点关注 `call_hf_processor_mm_only` 的设计决策,以及各模型特定重写(如 pixtral.py 中的 batch 维度处理)的逻辑,以理解多模态输入处理的最佳实践和潜在风险。
作者 vadiklyutiy · 合并时间 2026-03-26 16:21
自动禁用DeepGemm for Qwen3.5 on Blackwell,修复FP8量化精度下降问题。
建议技术管理者关注此PR,因为它揭示了DeepGemm在特定硬件和模型上的精度权衡。工程师应精读`vllm/config/vllm.py`和`fp8.py`中的实现,理解自动禁用机制和FP8量化栈传播逻辑,同时注意review中提到的未解决MoE问题,可能需要后续PR补充修复。
作者 fadara01 · 合并时间 2026-03-26 15:03
移除 Arm CI 的软失败标志并添加量化模型测试。
该 PR 值得快速浏览,以了解 CI 配置的变更和 Arm CPU 量化测试的添加。关注点在于测试覆盖的权衡决策,以及如何针对不同后端定制测试。
参与讨论