Prhub
← 返回仓库详情

标签聚合

PaddlePaddle/FastDeploy · 标签视图

标签列表

聚合结果

KVCache 相关 PR

2026-04-17

#7416 [KVCache] Mooncake storage register local buffer by chunk

作者 juncaipeng · 合并时间 2026-04-17 10:39

功能 重要性 5.01 洞察度 5.00

为 Mooncake KVCache 存储后端实现大缓冲区分块注册,支持超过 RDMA MR 大小限制的场景。

KVCache Feature Optimization infra

该 PR 值得精读,重点关注分块注册的设计决策、环境变量处理机制以及 review 中讨论的未解决疑虑(如资源泄漏、对齐问题)。建议结合后续 PR 观察是否补充错误处理和测试。

2026-04-16
optimization 重要性 6.40 洞察度 6.00

将 DeepSeekV3.2 模型 slot_mapping 计算从每层两次优化为单次预处理,提升推理性能约 8-14%。

Optimization Models KVCache OP

该 PR 值得精读,特别是设计决策将计算从模型层移至运行器层,展示了性能优化与代码抽象的权衡。关注 `_compute_position_ids_and_slot_mapping` 方法的实现细节,以及 review 中讨论的未解决点(如 GlmMoeDsa 兼容性),以便在其他优化中借鉴。

#7420 [BugFix][XPU] Fix kv_cache management bug

作者 ddchenhao66 · 合并时间 2026-04-16 15:45

缺陷修复 重要性 4.19 洞察度 4.00

修复 XPU model runner 在开启 attention store 时重复创建 KV cache 的问题。

XPU KVCache bugfix

该 PR 值得精读,特别是对于关注 XPU 平台优化和 KV cache 管理的工程师。关键设计决策在于将条件逻辑从单一检查扩展为多条件组合,这反映了对 cache 管理策略的细化,值得学习其与 GPU/Metax 实现对齐的思路。

2026-04-14
缺陷修复 重要性 6.00 洞察度 5.00

修复PD分离场景下prefill节点未及时更新prefix cache命中信息导致的低命中率问题。

bugfix KVCache Scheduler Engine

该PR值得精读,特别是关注prefill节点在PD分离架构中的cache状态管理设计。建议重点关注:1. update_cache_blocks参数选择的权衡(need_prefill_tokens vs num_computed_tokens)及其对cache一致性的影响;2. PD分离模式下prefill与decode节点职责划分的边界设计。

2026-04-13

#7241 [Optimization] 移除 num_blocks 上限限制

作者 yuanlehome · 合并时间 2026-04-13 22:07

性能优化 重要性 6.00 洞察度 5.00

移除KV Cache块数上限限制,提升高显存设备的显存利用率。

Optimization KVCache Engine

建议精读以理解KV Cache分配机制和移除限制的权衡。关注`iluvatar_worker.py`的未同步修改,以及测试baseline的普适性问题,可作为学习风险管理的案例。

2026-04-12

#7299 [Optim] Remove IPCLock between CacheManager and WorkerProcess

作者 Jiang-Jia-Jun · 合并时间 2026-04-12 13:59

性能优化 重要性 6.00 洞察度 5.00

移除CacheManager与WorkerProcess间的IPCLock进程间锁,优化性能并简化IPC组件。

Optimization KVCache Engine Refactor

建议精读以理解锁移除的设计决策,关注作者提到的Kernel bug修复细节。值得关注点包括swap任务同步机制如何确保互斥,以及是否有隐式测试覆盖。对于风险较高的DP+EP配置,建议团队补充回归测试。

2026-04-03

#7161 [BugFix] Set MC_MAX_MR_SIZE to avoid register hang in default

作者 juncaipeng · 合并时间 2026-04-03 10:51

缺陷修复 重要性 4.00 洞察度 3.00

为Mooncake存储设置默认MC_MAX_MR_SIZE环境变量,避免注册时挂起。

bugfix KVCache Others

该PR值得快速浏览,重点关注:1) 环境变量默认值设置模式(先检查后设置)值得借鉴;2) Copilot关于单位准确性和魔法数字处理的建议对代码质量有参考价值;3) 可作为配置管理最佳实践的简单案例。

2026-04-02