#43746 [Model Refactoring] Remove torch compile dependency in DSv4
原始 PR · 作者 WoosukKwon · 合并时间 2026-05-28 22:26
移除 DS V4 对 torch.compile 的依赖,改用可中断 CUDA 图
值得精读。本 PR 展示了如何通过手动融合 kernel 和利用 breakable CUDA graph 替换 torch.compile,是 vLLM 编译栈演进的重要一步。特别关注 `fused_mtp_input_rmsnorm.py` 中的 kernel 设计以及 `config.py` 中的自动启用策略。
参与讨论