# PR #22810 完整报告

- 仓库：`sgl-project/sglang`
- 标题：[diffusion] CI: refactor diffusion ci and reduce redundancy
- 合并时间：2026-04-15 10:12
- 原文链接：http://prhub.com.cn/sgl-project/sglang/pull/22810

---

# 执行摘要
本次 PR 对 sglang 仓库的扩散模型 CI 测试进行了系统性重构，主要删除冗余测试文件、合并测试套件并优化配置逻辑，旨在提升测试维护性和执行效率，同时确保始终检查一致性和性能。变更影响扩散模块的测试基础设施，对终端用户透明，但开发者需适应新结构。

# 功能与动机
PR 的动机源于简化组件准确性测试流程的需求。作者在 PR body 中指出："streamline component accuracy tests" 和 "always check consistency and perf, no fail-fast"，即希望减少测试冗余，避免因单个检查点失败而中断整个测试套件，从而提升 CI 的健壮性和开发体验。这响应了扩散模型测试日益复杂化带来的维护挑战。

# 实现拆解
1. **重构测试配置核心**：
 - 文件：`python/sglang/multimodal_gen/test/server/testcase_configs.py`
 - 关键符号：`DiffusionServerArgs` 类、`_infer_modality_from_model_path` 函数
 - 变更：移除 `modality` 字段的硬编码默认值（原为 `"image"`），改为可选并自动推断。新增 `_infer_modality_from_model_path` 函数，利用模型注册表（`get_model_info`）和任务类型（`ModelTaskType`）动态判断模态，并添加 `lru_cache` 装饰器以缓存结果，提升重复调用性能。
   ```python
   @lru_cache(maxsize=None)
   def _infer_modality_from_model_path(model_path: str) -> str:
       """根据模型路径自动推断模态类型（图像、视频或3D）。"""
       model_info = get_model_info(model_path)  # 从全局注册表查询模型信息
       if model_info is None:
           raise ValueError(f"无法解析模型信息: {model_path!r}")
       
       task_type = model_info.pipeline_config_cls.task_type
       if task_type == ModelTaskType.I2M:
           return "3d"  # 3D模型任务，如mesh生成
       if task_type.is_image_gen():
           return "image"  # 图像生成任务，包括T2I、I2I等
       return "video"  # 默认为视频生成任务，涵盖T2V、I2V等
   ```
 - 影响：所有扩散测试用例现在自动推断模态，减少手动配置错误，但依赖模型注册表的准确性。

2. **合并冗余测试文件**：
 - 删除 `test_accuracy_2_gpu_a.py` 和 `test_accuracy_2_gpu_b.py`，将原有 2-GPU 准确性测试用例迁移到新结构中；重命名 `test_accuracy_1_gpu_a.py` 为 `test_component_accuracy_1_gpu.py`，统一命名规范。
 - 新增 `accuracy_testcase_configs.py` 文件，集中定义 `ACCURACY_ONE_GPU_CASE_IDS` 和 `ACCURACY_TWO_GPU_CASE_IDS` 元组，并通过 `_select_accuracy_cases` 函数筛选用例，避免配置分散。
 - 示例代码片段：
   ```python
   def _select_accuracy_cases(cases: list[DiffusionTestCase], enabled_ids: tuple[str, ...]) -> list[DiffusionTestCase]:
       """根据启用的ID列表筛选测试用例。"""
       enabled = set(enabled_ids)
       return [case for case in cases if case.id in enabled]  # 过滤未启用的用例
   ```
 - 影响：测试套件更简洁，易于维护和扩展新用例。

3. **优化测试执行逻辑**：
 - 文件：`python/sglang/multimodal_gen/test/server/test_server_common.py`
 - 关键符号：`run_case_check` 函数、`failures` 列表
 - 变更：将原本分散的性能验证、一致性检查、LoRA API 测试等封装到 `run_case_check` 中，该函数捕获异常并记录失败信息，最后统一报告，避免单点失败导致测试提前终止。新增 `validate_mesh_output` 辅助函数，专门处理 3D 模型输出验证。
 - 影响：提升测试健壮性，开发者能一次性看到所有失败点，便于调试。

4. **调整 CI 工作流和脚本**：
 - 更新 `.github/workflows/pr-test-multimodal-gen.yml`，简化触发逻辑，减少冗余步骤；修改 `scripts/ci/utils/diffusion/diffusion_case_parser.py` 中的 `_extract_case_ids_from_list` 函数，适配新的测试用例结构。
 - 影响：CI 执行更高效，但需确保重构后所有测试仍能被正确触发和解析。


## 关键源码片段

### `python/sglang/multimodal_gen/test/server/testcase_configs.py`

核心测试配置文件，修改了 DiffusionServerArgs 类以支持自动模态推断，并新增缓存函数，影响所有扩散模型测试用例的配置解析。

```python
@lru_cache(maxsize=None)
def _infer_modality_from_model_path(model_path: str) -> str:
    """根据模型路径自动推断模态类型（图像、视频或3D）。"""
    model_info = get_model_info(model_path)  # 从注册表获取模型信息
    if model_info is None:
        raise ValueError(f"无法解析模型信息: {model_path!r}")
    
    task_type = model_info.pipeline_config_cls.task_type  # 获取任务类型
    if task_type == ModelTaskType.I2M:
        return "3d"  # 3D模型任务
    if task_type.is_image_gen():
        return "image"  # 图像生成任务
    return "video"  # 默认为视频生成任务
```

### `python/sglang/multimodal_gen/test/server/test_server_common.py`

测试公共逻辑文件，引入 run_case_check 函数聚合多个验证步骤的失败信息，避免单点失败导致测试中断，提升测试健壮性。

```python
def run_case_check(name: str, fn: Callable[[], None]) -> None:
    """运行单个检查点，捕获异常并记录失败信息。"""
    try:
        fn()  # 执行检查函数
    except BaseException as exc:
        if isinstance(exc, (KeyboardInterrupt, SystemExit)):
            raise  # 重新抛出中断异常
        failures.append((name, str(exc)))  # 记录失败名称和消息
```

# 评论区精华
本次 PR 无 review 评论，讨论较少，变更主要由作者通过多次提交（如 "upd" 和 "fix ut"）迭代完成，最终由自己合并。这表明重构过程可能涉及内部调整，但未引发团队争议。

# 风险与影响
- **技术风险**：测试覆盖变更可能导致某些边缘用例未被覆盖，引发回归错误；自动模态推断依赖外部注册表，若模型信息缺失会抛出异常；CI 工作流简化可能意外跳过必要测试。
- **影响范围**：对用户无直接影响，但提升开发者效率；系统层面，测试代码更整洁，长期利于维护；团队需更新测试文档或指南以反映新结构。

# 关联脉络
从近期历史 PR 看，本次重构与扩散模块的其他改进紧密相关：
- PR 22763（自动启用最佳并行设置）优化了扩散模型性能配置，本 PR 的 CI 重构确保这些配置能高效测试。
- PR 22667（支持 LTX-2.3 两阶段视频生成）扩展了模型功能，本 PR 通过测试合并为新功能集成提供了稳定的 CI 基础。
整体上，这些 PR 共同推动扩散模块向更高效、可维护的方向演进，反映团队在基础设施上的持续投入。