#37280 [Bugfix] Pass drafter quant_config to ParallelLMHead in Eagle3
原始 PR · 作者 mgehre-amd · 合并时间 2026-03-25 19:42
修复Eagle3中quantized lm_head权重加载失败bug,传递quant_config到ParallelLMHead。
对于涉及Eagle3或量化开发的工程师,建议精读`llama_eagle3.py`中的quant_config传递逻辑,关注设计决策;对于一般用户,可快速浏览以了解修复内容。
参与讨论