执行摘要
扩展 LoRA 支持到 Qwen3-VL-30B-A3B-Instruct 模型的 MoE 组件和嵌入层。
PR body 中明确动机为 'Support Qwen3-VL-30B-A3B-Instruct',评论中进一步解释需要扩展 LoRA 支持到该模型的特定组件,如嵌入层和 MoE 专家层,以适配新模型架构。
建议精读此 PR,关注 LoRA 模式扩展的设计决策和测试准确性验证方法。同时,注意未解决的安全和准确性风险,需在后续迭代中处理。
Review 中 highlights:gemini-code-assist[bot] 建议为 slice_moe_lora_a_weights 添加类型提示,但未明确采纳;Copilot 指出 auto_detect_lora_target_modules 可能遗漏 embed_tokens,建议显式检测;Copilot 提到 kl_v2 函数误标为 KL 散度,实际计算半均方误差,需重命名或更正;Copilot 警告从远程加载 .pt 文件使用 torch.load 可能执行恶意代码,建议使用安全格式或 weights_only=True;Fridge003 建议移除旧测试并调整测试 TP 大小,yushengsu-thu 确认采纳;sshleifer 指出与 PR 21466 相似,需更紧 KL 断言。
参与讨论