#43130 [Spec Decode] Support non-MTP speculation for NemotronH
原始 PR · 作者 benchislett · 合并时间 2026-05-20 21:15
为 NemotronH 添加非 MTP 推测解码支持
建议精读 `nemotron_h.py` 中 `forward` 方法的改动,理解 `_maybe_add_hidden_state` 的收集机制。同时关注 `EagleModelMixin` 的定义,以评估后续推测解码设计的可扩展性。
参与讨论