#38478 [Bug fix][Quantization] Fix dummy weight loading
原始 PR · 作者 Josephasafg · 合并时间 2026-03-31 04:38
修复使用dummy加载格式时在线量化方法的内存不足问题。
对于从事量化、模型加载或layerwise reloading的工程师,建议精读此PR,因为它展示了如何正确集成dummy weight加载与layerwise处理机制,设计决策如deferred initialization和逻辑集中化值得学习。同时,关注review中讨论的边缘案例处理,以增强代码健壮性。
参与讨论