#37503 [4/n] Migrate FP4/W4A8 CUTLASS kernels to torch stable ABI
原始 PR · 作者 mikaylagawarecki · 合并时间 2026-04-01 01:21
将FP4/W4A8 CUTLASS内核迁移到torch stable ABI,以提升ABI兼容性和系统可维护性。
建议技术管理者和工程师精读此PR,重点关注设计决策如stable ABI的集成模式、条件编译策略以及out_variant标签的处理方式。代码变更展示了如何优雅地迁移高性能内核到新ABI框架,对于涉及量化或CUTLASS集成的项目具有参考价值。
参与讨论