#39717 [Bugfix] Reject non-nvfp4 dtypes when using the flashinfer_nvlink_one_sided all2all backend
作者 tlrmchlsmth · 合并时间 2026-04-14 03:13
修复flashinfer_nvlink_one_sided后端因工作空间大小硬编码导致的非nvfp4数据类型静默数据损坏问题。
该PR值得快速浏览以了解数据类型与后端兼容性的重要约束。虽然实现简单,但揭示了分布式计算中工作空间硬编码可能导致的静默错误模式,对于处理量化或自定义后端的工程师有警示价值。关注点:错误信息的设计是否足够清晰可操作。
参与讨论