#42671 fix: use keyword arguments for shard_id and expert_id in weight_loade…

原始 PR 作者 junyanxu 合并时间 2026-05-19 13:29 文件变更 0 提交数 2 评论 1 代码增减 +0 / -0

执行摘要

修复 Qwen3-VL MoE 权重加载关键字参数

PR 正文指出该变更修复了 Qwen3-VL-235B-A22B-Instruct 在 TPU 推理中的崩溃问题，并引用了 qwen3_moe.py 中第 645 行的 load_fused_expert_weights 调用，该调用原本使用位置参数，但新接口要求 shard_id 和 expert_id 作为关键字参数。

该 PR 为小范围 bugfix，变更简单直接，建议合入。值得关注的是，后续类似权重加载调用应统一使用关键字参数，以避免未来接口变更导致的兼容性问题。

讨论亮点

review 中无实质性讨论，审核人 hmellor 批准了 PR。Claude 和 Gemini 的自动评论未提供具体反馈。

实现拆解

定位问题：在 vllm/model_executor/models/qwen3_moe.py 第 645 行，load_fused_expert_weights 被调用时使用了位置参数传递 shard_id 和 expert_id。
变更方案：将该调用改为显式关键字参数形式，例如 load_fused_expert_weights(..., shard_id=..., expert_id=...)。
影响范围：仅修改该行代码，不影响其他模型或功能。

文件	模块	状态	重要度
`vllm/model_executor/models/qwen3_moe.py`	模型层	modified	3.0

分析完成后，这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论，后续有更多讨论时会体现在这里。

风险与影响

风险极低。变更仅涉及一行代码，将位置参数改为关键字参数，不改变业务逻辑。但需确认该函数签名是否在其他地方也有位置调用方式，避免潜在的不一致。具体文件名：vllm/model_executor/models/qwen3_moe.py。

影响范围有限：仅修复 Qwen3-VL 大模型在 TPU 上的 MoE 权重加载崩溃问题，对其他模型或无 TPU 的场景无影响。

小范围修复仅单行变更

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接，后续同步到相关引用后会出现在这里。

#42671 fix: use keyword arguments for shard_id and expert_id in weight_loade…

执行摘要

修复 Qwen3-VL MoE 权重加载关键字参数

实现拆解

评论区精华

没有提炼出高价值讨论线程

风险与影响

关联 Issue

未识别关联 Issue

完整报告

执行摘要

功能与动机

实现拆解

由于材料中未提供具体源码片段，此处仅描述：变更位于 `qwen3_moe.py` 文件的 `load_fused_expert_weights` 调用行，将位置参数替换为关键字参数。

评论区精华

风险与影响

关联脉络

参与讨论