#21662 [Fix] Fix weight_loader property assignment for qwen3-next FP8 models

原始 PR 作者 Fridge003 合并时间 2026-03-30 16:35 文件变更 1 提交数 2 评论 13 代码增减 +17 / -4

执行摘要

修复 Qwen3-Next FP8 模型权重加载时的属性赋值错误。

在加载Qwen/Qwen3-Coder-Next-FP8权重时出现AttributeError，错误信息为'property "weight_loader" of "ModelWeightParameter" object has no setter'，原因是BasevLLMParameter.weight_loader为只读属性（无setter），直接赋值失败。Issue #21638详细描述了此bug。

建议快速浏览以了解权重加载机制的细微调整，重点关注_override_weight_loader函数的设计，学习如何处理属性与只读属性的差异。

讨论亮点

Issue评论中，ranjiewen提出如何处理'weight_scale_inv'参数的问题，但PR未直接回应，可能为未解决疑虑。

实现拆解

在qwen3_next.py中，将__init__方法中的直接赋值self.in_proj_qkvz.weight.weight_loader = ...替换为调用静态方法_override_weight_loader；新增_override_weight_loader方法，该方法检测参数是否有_weight_loader属性（量化模型使用ModelWeightParameter）或weight_loader属性（非量化模型），并相应赋值以处理只读属性问题。

文件	模块	状态	重要度
`python/sglang/srt/models/qwen3_next.py`	srt/models	modified	5.0

关键符号

_override_weight_loader __init__

分析完成后，这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

处理 weight_scale_inv 参数问题 question

在 Issue #21638 评论中，ranjiewen 询问如何对待 'weight_scale_inv' 参数，可能与权重加载相关

结论：未在 PR 中直接解决或讨论，状态未决 · 待处理

风险与影响

风险较低：助手函数需准确区分量化与非量化参数，否则可能导致其他使用ModelWeightParameter的模型加载失败；但测试覆盖良好（包括test_qwen3_next_models.py），回归风险小。

影响范围有限：用户可正常加载Qwen3-Coder-Next-FP8量化模型，解决了特定bug；系统层面修复了权重加载逻辑，不影响其他功能模块；团队解决了模型部署障碍，提升了量化模型支持。

量化兼容性问题属性处理复杂性

关联 Issue

#21638 [Bug] Not able to load weights for qwen3-next-coder fp8 weight

完整报告

执行摘要

本PR修复了Qwen3-Next FP8模型在加载权重时因weight_loader属性为只读而导致的AttributeError，通过引入助手函数_override_weight_loader正确处理量化参数，使模型能正常启动，影响限于该模型类型。

功能与动机

Issue #21638报告了在加载Qwen/Qwen3-Coder-Next-FP8权重时出现的bug，错误信息为AttributeError: property 'weight_loader' of 'ModelWeightParameter' object has no setter。原因是BasevLLMParameter.weight_loader是只读属性，无法直接赋值，导致量化模型加载失败。

实现拆解

修改文件python/sglang/srt/models/qwen3_next.py，主要改动包括：

在__init__方法中，将原本的直接赋值（如self.in_proj_qkvz.weight.weight_loader = ...）替换为调用_override_weight_loader方法。

新增静态方法_override_weight_loader，其核心逻辑检测参数类型：

param = module.weight
if hasattr(param, "_weight_loader"):
    param._weight_loader = new_loader # 处理量化模型（ModelWeightParameter）
else:
    param.weight_loader = new_loader # 处理非量化模型

评论区精华

由于没有正式review评论，Issue评论中ranjiewen提出：“how to deal with 'weight_scale_inv' parameter?”，该问题未在PR中直接解决，表明可能还有其他量化相关参数需后续处理。

风险与影响

风险：助手函数需准确区分量化与非量化参数，否则可能引发其他模型加载错误；但现有测试（如test_qwen3_next_models.py）已覆盖，回归风险低。

影响：修复后，Qwen3-Coder-Next-FP8模型可正常加载，提升了量化模型支持；系统其他部分不受影响，团队解决了特定部署问题。

关联脉络

与PR #21234（支持AMD MXFP4 Qwen3.5模型）相关联，两者都涉及Qwen系列模型的量化权重加载，显示了项目在扩展量化格式支持上的持续努力。近期历史PR中，量化相关变更频繁，如PR #21625和#18461，反映了对FP8、MXFP等量化技术的重视。

#21662 [Fix] Fix weight_loader property assignment for qwen3-next FP8 models

执行摘要

修复 Qwen3-Next FP8 模型权重加载时的属性赋值错误。

实现拆解

评论区精华

风险与影响

关联 Issue

完整报告

参与讨论