#39032 NemotronH default mamba_ssm_cache_dtype=float32; enable auto-hook for NemotronHNanoVLV2Config
原始 PR · 作者 netanel-haber · 合并时间 2026-04-07 03:47
修复NemotronH模型mamba_ssm_cache_dtype默认值错误,统一为float32避免精度问题。
该PR值得精读,因为它展示了模型配置默认值的重要性和如何通过重构提高代码复用性。关注点包括:1. 默认值从float16到float32的变更理由。2. update_mamba_ssm_cache_dtype方法的提取如何使配置逻辑更清晰。3. NemotronHNanoVLV2Config如何通过text_config继承配置。
参与讨论