#23270 [MUSA] Resolve output garbage in Context Parallel on MusaFlashAttentionBackend
原始 PR · 作者 froststeam · 合并时间 2026-04-23 11:22
修复MUSA后端Context Parallel注意力前向扩展的输出垃圾问题,确保CP工作负载在MUSA设备上正常运行。
此PR值得精读,特别是关注`musa_cp_attn_forward_extend`函数的设计和级联注意力逻辑的调整。对于在MUSA后端上实现CP支持的工程师,这些变更提供了重要的兼容性解决方案和代码组织范例。
参与讨论