#44174 [CI] Align PD tests to HMA on by default
原始 PR · 作者 NickLucche · 合并时间 2026-06-04 00:04
CI 测试移除显式 HMA 标记,对齐默认启用
可安全合并。建议后续关注 HMA 功能演进,确保 CI 持续对齐。
标签列表
聚合结果
原始 PR · 作者 NickLucche · 合并时间 2026-06-04 00:04
CI 测试移除显式 HMA 标记,对齐默认启用
可安全合并。建议后续关注 HMA 功能演进,确保 CI 持续对齐。
支持推理模型基准测试的思考模式
该 PR 值得精读,特别是对负责基准测试和推理性能分析的工程师。其设计简洁、聚焦,通过最小的 CLI 改动解决了一个实际的基准测试盲区。建议关注后续是否扩展支持更多数据集。
修复 parser 测试与 CI 触发路径
建议 PR 阅读者关注测试与 CI 触发路径的一致性,类似的源文件-测试触发关系应在添加新模块时一并配置。
对 gfx90a 跳过 FP8 reload 测试
建议精读 `_fp8_reload_unsupported()` 的实现,作为处理平台特定测试跳过的良好范例——它展示了如何在不修改全局平台 API(如 `supports_fp8()`)的前提下,通过本地化函数解决特定硬件的测试问题。
修复 ROCm wvSplitK GEMM 回退测试的边界值
值得合并。虽然变更量小,但确保了测试与代码逻辑的一致性,避免了 CI 的虚假失败。
修复稀疏NCCL权重传输测试构造
本 PR 为常规 bugfix,变更简单直接,值得快速合并以恢复 CI 稳定性。可关注后续对 `NCCLWeightTransferEngine` 构造签名的进一步演进。
重构PP调度避免气泡,吞吐最高提升3倍
此 PR 是 ModelRunnerV2 的重要性能里程碑,强烈建议精读。重点关注 `PPHandler` 的延迟消费与专用通信器设计,这是一种解耦同步通信的通用模式。同时关注 CPU mirror 与 GPU 状态一致性维护策略。建议在后续 PR 中增加更多极端场景测试(如高并发出错恢复)。
在基准测试中支持客户端侧图像编码
值得精读,特别是如何复用 `vllm.multimodal.utils` 中的工具实现客户端编码,以及如何在不破坏现有行为的前提下逐步添加特性。设计决策清晰,适合作为多模态基准测试扩展的参考。