#39844 [XPU] fix all_reduce all-zero accuracy issue under torch.compile
作者 chaojun-zhang · 合并时间 2026-04-18 10:33
修复 XPU 平台在 torch.compile 模式下 all_reduce 返回全零的精度问题。
该 PR 值得精读,因为它揭示了 torch.compile 在优化 in-place 操作时可能导致的隐蔽精度问题,并展示了通过 out-of-place 操作规避编译器优化的实用技巧。关注点:条件克隆的逻辑设计(`torch.compiler.is_compiling()`)和类型提示的添加如何提升代码健壮性。
参与讨论