#22672 reland [Diffusion] Add FLUX.1-dev ModelOpt NVFP4 support
作者 BBuf · 合并时间 2026-04-14 15:00
为扩散模型添加FLUX.1-dev ModelOpt NVFP4支持,提升推理性能22.9%。
该PR值得精读,特别是关注NVFP4集成设计、量化配置灵活性和性能优化策略。建议关注以下设计决策: 1. `swap_weight_nibbles`配置如何平衡不同导出格式的兼容性。 2. JIT预热机制在torch.compile环境下的优化作用。 3. transformer组件加载逻辑的修改如何避免全局覆盖冲突。