#22811 Fix for the low-probability garbled output issue in the GLM-5 series models.
作者 zRzRzRzRzRzRzR · 合并时间 2026-04-17 09:52
修复 GLM-5 系列模型在 HiCache 下低概率输出乱码问题,确保 NSA 索引读取与缓存加载同步。
该 PR 值得精读,因为它揭示了 HiCache 与 NSA 模型交互时一个微妙但关键的同步问题。关注点在于如何通过统一的 `layer_transfer_counter` 机制来协调异步缓存加载与数据访问,这是分布式缓存系统中常见的并发控制模式。
参与讨论