Prhub

#21496 Revert "bugfix for weight loading for qwen3-next"

原始 PR 作者 Fridge003 合并时间 2026-03-27 07:17 文件变更 1 提交数 1 评论 1 代码增减 +2 / -2

执行摘要

回退 Qwen3-next 模型权重加载属性的错误修复,将 _weight_loader 恢复为 weight_loader。

根据 PR body,本 PR 旨在回退 #21313 的变更,推测原因是之前的 bugfix 可能引入了新问题或未被正确验证,需要恢复原始属性名以避免权重加载错误。

建议工程师关注权重加载测试的覆盖情况,确认回退是否解决了潜在问题;对于技术管理者,需注意此回退可能反映之前修复的不稳定性,值得审视相关测试和验证。

讨论亮点

没有 review 讨论,因此无争议点、决策结论或未解决疑虑。

实现拆解

实现简单,仅修改了 'python/sglang/srt/models/qwen3_next.py' 文件。在 init 方法中,将 self.in_proj_qkvz.weight._weight_loader 改回 self.in_proj_qkvz.weight.weight_loader,并同样处理 self.in_proj_ba.weight 属性,完全撤销 #21313 的变更。

文件 模块 状态 重要度
python/sglang/srt/models/qwen3_next.py models/qwen3_next modified 6.0

关键符号

__init__ _make_packed_weight_loader

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

回退操作可能重新引入 #21313 之前修复的权重加载 bug,如果未充分测试,可能导致 Qwen3-next 模型初始化失败或权重加载不正确。变更涉及核心模型属性,需确保与整体系统的兼容性,避免回归问题。

影响范围限于使用 Qwen3-next 模型的场景,具体是权重加载逻辑;影响程度为中等,仅涉及特定模型初始化,但权重加载是关键路径,错误可能影响模型功能。

回退可能重新引入 bug 权重加载属性变更风险

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论