#39989 [BugFix][XPU] fix lora ops bgmv_expand size not match
原始 PR · 作者 Liangliang-Ma · 合并时间 2026-04-20 08:24
修复XPU后端LoRA运算中bgmv_expand因权重与输出张量维度不匹配导致的运行时错误。
该PR值得精读,特别是对于在XPU后端上使用LoRA的开发者。关注点包括: 1. **设计决策**:如何通过条件分支和现有算子(`bgmv_expand_slice`)优雅处理维度不匹配,而非强制统一维度,这反映了对实际部署场景(如填充logits)的考量。 2. **实现细节**:注意权重截断时的`contiguous()`调用,确保内存布局兼容性。 3. **扩展性**:此模式可能为其他后端(如CUDA)的类似问题提供参考,但当前仅限XPU。
参与讨论