# PR #20862 完整报告

- 仓库：`sgl-project/sglang`
- 标题：[Diffusion] add FireRed-Image-Edit models
- 合并时间：2026-03-23 10:27
- 原文链接：http://prhub.com.cn/sgl-project/sglang/pull/20862

---

# 执行摘要

- 一句话：添加 FireRed-Image-Edit 模型支持，解决配置差异问题。
- 推荐动作：该 PR 值得精读，了解如何通过配置适配扩展新模型支持，重点关注 token ID 字段的添加和注册逻辑的设计决策。

# 功能与动机

FireRed-Image-Edit 模型结构与 Qwen-Image-Edit 系列一致，但配置中缺失 'zero_cond_t' 字段，且多模态 token ID 放置于 text_config 中，导致部署时出现 AttributeError。PR 旨在解决这些问题以实现 SGLang Diffusion 对这两个模型的正确支持。

# 实现拆解

在 registry.py 中添加 FireRed-Image-Edit 模型的注册，使用与 Qwen-Image-Edit-2509 相同的 pipeline_config 和 sampling_param；在 qwen_image.py 的 QwenImageArchConfig 类中添加 vision_start_token_id、vision_end_token_id、vision_token_id、image_token_id、video_token_id 字段，以适配新模型的配置结构。

关键文件：
- `python/sglang/multimodal_gen/registry.py`（模块 multimodal_gen）: 注册新模型，启用 FireRed-Image-Edit 支持
- `python/sglang/multimodal_gen/configs/models/encoders/qwen_image.py`（模块 multimodal_gen/configs）: 添加多模态 token ID 字段，解决配置解析错误

关键符号：QwenImageArchConfig, _register_configs


# 评论区精华

review 中讨论了是否需要 model_detectors 参数，mickqian 询问其必要性，yuumn 测试后移除以避免冗余；gemini-code-assist[bot] 评论实现正确。

- model_detectors 参数移除 (design): 移除 model_detectors，因为注册时不需要。

# 风险与影响

- 风险：修改 QwenImageArchConfig 类添加字段可能影响 Qwen 系列模型，但作者验证 token ID 值与 Qwen 系列相同，不引入回归风险；注册配置选择需确保与模型兼容，测试已通过验证，风险低。
- 影响：用户可部署 FireRed-Image-Edit 模型，扩展了 SGLang 的模型覆盖；系统层面仅扩展注册和配置，对核心路径无影响；团队方面展示了如何通过配置适配扩展外部模型支持。
- 风险标记：配置变更风险 , 测试覆盖

# 关联脉络

- 暂无明显关联 PR