#38373 [torch.compile]: Disable Sequence Parallelism (SP) for piecewise compilation
原始 PR · 作者 SouthWest7 · 合并时间 2026-04-27 01:44
禁用 piecewise 编译时的 Sequence Parallelism,仅保留 full-graph 支持
建议所有使用 vLLM 中 torch.compile 与 SP 的开发者和研究员阅读此 PR 的讨论,特别是关于配置降级策略和 pass 断言的设计,了解为何 piecewise 编译下的 SP 不被支持。对于希望开启 SP 的用户,文档应明确告知需要启用 inductor 分区或清空 splitting_ops。
参与讨论