Prhub

#42671 fix: use keyword arguments for shard_id and expert_id in weight_loade…

原始 PR 作者 junyanxu 合并时间 2026-05-19 13:29 文件变更 0 提交数 2 评论 1 代码增减 +0 / -0

执行摘要

修复 Qwen3-VL MoE 权重加载关键字参数

PR 正文指出该变更修复了 Qwen3-VL-235B-A22B-Instruct 在 TPU 推理中的崩溃问题,并引用了 qwen3_moe.py 中第 645 行的 load_fused_expert_weights 调用,该调用原本使用位置参数,但新接口要求 shard_idexpert_id 作为关键字参数。

该 PR 为小范围 bugfix,变更简单直接,建议合入。值得关注的是,后续类似权重加载调用应统一使用关键字参数,以避免未来接口变更导致的兼容性问题。

讨论亮点

review 中无实质性讨论,审核人 hmellor 批准了 PR。Claude 和 Gemini 的自动评论未提供具体反馈。

实现拆解

  1. 定位问题:在 vllm/model_executor/models/qwen3_moe.py 第 645 行,load_fused_expert_weights 被调用时使用了位置参数传递 shard_idexpert_id
  2. 变更方案:将该调用改为显式关键字参数形式,例如 load_fused_expert_weights(..., shard_id=..., expert_id=...)
  3. 影响范围:仅修改该行代码,不影响其他模型或功能。
文件 模块 状态 重要度
vllm/model_executor/models/qwen3_moe.py 模型层 modified 3.0

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

风险极低。变更仅涉及一行代码,将位置参数改为关键字参数,不改变业务逻辑。但需确认该函数签名是否在其他地方也有位置调用方式,避免潜在的不一致。具体文件名:vllm/model_executor/models/qwen3_moe.py

影响范围有限:仅修复 Qwen3-VL 大模型在 TPU 上的 MoE 权重加载崩溃问题,对其他模型或无 TPU 的场景无影响。

小范围修复 仅单行变更

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论