#44429 [Model] Add Gemma4 Unified (encoder-free) support
原始 PR · 作者 lucianommartins · 合并时间 2026-06-04 03:01
新增 Gemma4 Unified 编码器无关多模态模型
值得精读,特别关注子类化父类避免分支的设计模式,以及量化条件处理和嵌入数据类型的讨论。后续需要跟进 PR#44340 的修复并验证音频回归。
标签列表
聚合结果
原始 PR · 作者 lucianommartins · 合并时间 2026-06-04 03:01
新增 Gemma4 Unified 编码器无关多模态模型
值得精读,特别关注子类化父类避免分支的设计模式,以及量化条件处理和嵌入数据类型的讨论。后续需要跟进 PR#44340 的修复并验证音频回归。
修复后替换别名路径的 LoRA 去重遗漏
值得合并,修复了明确的回归场景。可作为学习 LoRA 模块包装机制的典型示例。
重构PP调度避免气泡,吞吐最高提升3倍
此 PR 是 ModelRunnerV2 的重要性能里程碑,强烈建议精读。重点关注 `PPHandler` 的延迟消费与专用通信器设计,这是一种解耦同步通信的通用模式。同时关注 CPU mirror 与 GPU 状态一致性维护策略。建议在后续 PR 中增加更多极端场景测试(如高并发出错恢复)。
MRV2 支持 Llama 与 Mistral 密集模型
建议在合并后密切监控 Llama/Mistral 相关测试的稳定性,并优先处理 force_v1_runner 的环境变量覆盖问题。该 PR 值得精读,展示了 MRV2 激活的标准流程测试适配模式。
原始 PR · 作者 pschlan-amd · 合并时间 2026-06-02 22:50
修复 Kimi-Linear 模型 AITER 融合崩溃
建议合并。修复是精确且低风险的,已通过 e2e 验证。未来可考虑在类似属性访问模式中统一使用 `getattr` 回退或定义接口契约。
修复多模态模型 GDN prefill 后端选择 bug
此 PR 是典型的数据契约 bugfix,改动极小但影响关键路径,值得快速合入。建议关注类似的多模态配置属性访问模式,并在仓库内建立统一使用 `hf_text_config` 的惯例。
原始 PR · 作者 lucianommartins · 合并时间 2026-06-02 21:42
修复 Gemma4 启动时因 transformers 升级导致的崩溃
建议批准合并,修复明确且无副作用。同时建议后续为 `Gemma4MultiModalProcessor` 的 `_apply_hf_processor_text_only` 添加单元测试,防止类似回归。
原始 PR · 作者 Gruner-atero · 合并时间 2026-06-02 21:41
修复混合Mamba模型block_size同步问题
该 PR 是一个针对明确 bug 的精准修复,改动量小,逻辑清晰,且带有单元测试。值得精读,尤其是理解 `_align_hybrid_block_size` 对 block_size 的影响以及 `EngineCoreReadyResponse` 的同步机制。对于维护监控指标正确性的开发者有参考价值。