#17985 [MUSA][9/N] Add FA3 attention backend support through MATE (MUSA AI Tensor Engine)
原始 PR · 作者 froststeam · 合并时间 2026-04-03 06:04
为 MUSA GPU 添加基于 MATE 的 FA3 注意力后端支持。
建议技术管理者和工程师精读此 PR,以了解 MUSA 硬件集成策略。重点关注 `get_flash_attention_context` 方法和调度元数据注入机制的设计决策,以及 review 中关于性能与抽象的权衡讨论。对于涉及多平台支持的开发者,可参考此 PR 的 vendor-isolated 模式。
参与讨论