#7420 [BugFix][XPU] Fix kv_cache management bug
作者 ddchenhao66 · 合并时间 2026-04-16 15:45
修复 XPU model runner 在开启 attention store 时重复创建 KV cache 的问题。
该 PR 值得精读,特别是对于关注 XPU 平台优化和 KV cache 管理的工程师。关键设计决策在于将条件逻辑从单一检查扩展为多条件组合,这反映了对 cache 管理策略的细化,值得学习其与 GPU/Metax 实现对齐的思路。