#18648 [diffusion] hardware: support FA3 attention backend on MUSA (attn backend, 14/N)
原始 PR · 作者 yeahdongcn · 合并时间 2026-04-02 01:49
为MUSA平台扩散模型添加FA3注意力后端支持,提升MTGPU性能。
该PR值得精读,特别是musa.py中的后端选择逻辑,展示了如何集成供应商特定优化同时保持代码结构统一。关注设计决策如回退机制、平台抽象和依赖版本管理,这些对类似硬件扩展有借鉴意义。
参与讨论