#43660 [Attention][AMD] Standardize kv layout to blocks first for AMD
原始 PR · 作者 NickLucche · 合并时间 2026-05-29 01:28
AMD 注意力后端 KV 缓存布局标准化为 blocks-first
**建议精读**:该 PR 体现了注意力后端标准化布局的设计思路,特别是通过 `supports_kv_connector` 类方法实现兼容性控制的设计模式值得借鉴。对于从事 KV connector 或 AMD 后端开发的工程师,理解此变更有助于后续参与模型特定 KVCacheSpec 的实现。 **注意点**:review 中提到的 `rocm.py` 硬编码布局问题虽已解决,但后续维护时应保持警惕,避免在未启用 KV connector 时调用这些函数。
参与讨论