#20137 [diffusion] Support nvfp4 for Flux.2
原始 PR · 作者 ykcai-daniel · 合并时间 2026-03-25 08:28
为Flux.2扩散模型添加NVFP4量化支持,实现权重加载和推理后端集成。
此PR值得精读,特别是对于关注量化技术或扩散模型集成的工程师。关键设计决策包括:参数映射规则以支持复杂checkpoint格式、量化配置的动态构建方式、以及后端选择策略(如优先使用comfy-kitchen)。建议关注`modelopt_quant.py`中的量化实现细节和`fsdp_load.py`中的dtype处理逻辑,以理解系统如何优雅处理混合精度权重。
参与讨论