#37887 [ROCm][perf] fix Aiter sparse MLA with MTP>1
原始 PR · 作者 gronsti-amd · 合并时间 2026-04-01 07:22
修复 ROCm 上 speculative decoding 与 MTP 方法及多推测 tokens 的兼容性问题,支持 DeepSeek v3.2。
建议精读此 PR,以学习如何处理注意力元数据类型验证和重构函数接口。关注 build_per_group_and_layer_attn_metadata 的设计决策,它分离了组和层元数据,提高了代码清晰度和健壮性。
参与讨论