#20430 [diffusion][CI] Add CI for MOVA model inference

原始 PR 作者 CloudRipple 合并时间 2026-03-25 02:28 文件变更 2 提交数 10 评论 38 代码增减 +54 / -0

执行摘要

为 MOVA-360p 视频生成模型添加 CI 测试，覆盖单 GPU 和双 GPU 配置。

根据PR body描述，动机是'add support for testing the MOVA-360p video generation model in the multimodal generation test suite'，目的是为新的视频生成模型提供持续集成测试，确保其在不同硬件配置下的稳定性和兼容性。

该PR值得快速浏览以了解新模型集成到测试套件的模式。重点关注如何重用现有sampling_params避免冗余定义，以及测试用例中不同并行配置（如tp_size、ring_degree）的设计，这对理解扩散模型测试框架有参考价值。

讨论亮点

review中，gemini-code-assist[bot]建议为模型常量添加分组注释并减少测试用例中DiffusionServerArgs的重复配置，但未明确是否采纳；mickqian询问'could we reuse the existing sampling_params?'，CloudRipple回复'ok, we fixed this'，commit历史显示后续将MOVA_I2V_360P_sampling_params替换为TI2V_sampling_params，体现了对设计优化的响应。讨论聚焦于代码组织、重用性和维护性。

实现拆解

实现主要涉及两个文件：在python/sglang/multimodal_gen/test/test_utils.py中添加DEFAULT_MOVA_360P_MODEL_NAME_FOR_TEST常量；在python/sglang/multimodal_gen/test/server/testcase_configs.py中，将该常量添加到可用模型列表，并创建四个DiffusionTestCase实例：一个单GPU案例（'mova_360p_1gpu'）和三个双GPU案例（'mova_360p_tp2'、'mova_360p_ring1_uly2'、'mova_360p_ring2_uly1'），使用现有的TI2V_sampling_params并设置run_perf_check=False以避免性能检查。

文件	模块	状态	重要度
`python/sglang/multimodal_gen/test/server/testcase_configs.py`	multimodal_gen test server	modified	7.0
`python/sglang/multimodal_gen/test/test_utils.py`	multimodal_gen test utils	modified	5.0

分析完成后，这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

重用现有 sampling_params 设计

mickqian 询问 'could we reuse the existing sampling_params?'，CloudRipple 回复已修复，commit 显示改用 TI2V_sampling_params。

结论：采纳建议，避免重复定义，使用现有的 TI2V_sampling_params。 · 已解决

代码重复和注释改进 style

gemini-code-assist[bot] 建议为模型常量添加分组注释和减少 DiffusionServerArgs 的重复配置以提高可维护性。

结论：未在材料中明确是否采纳，但常量注释已添加（如 PR body 提到 '# MOVA video generation models'）。 · partially resolved

风险与影响

风险较低，主要集中在测试代码的维护性：测试用例中的DiffusionServerArgs配置存在重复（如review指出），可能导致未来更新困难；测试未启用性能检查（run_perf_check=False），可能遗漏性能回归验证；但变更范围限于测试套件，不影响核心业务逻辑，回归风险小。

影响范围有限，主要针对测试基础设施：用户无直接影响，但工程师在维护多模态生成测试时需处理新模型配置；系统上，新增CI测试可能略微增加CI运行时间，但增强了模型覆盖；团队需关注测试用例的配置模式以保持一致性。

代码重复缺少性能测试

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接，后续同步到相关引用后会出现在这里。

完整报告

执行摘要

此PR为MOVA-360p视频生成模型添加了CI测试，通过定义模型常量和配置多个测试用例（单GPU和双GPU），扩展了多模态生成测试套件的覆盖范围。变更简单且风险低，但review中讨论了代码组织和重用性问题，建议关注测试配置的设计模式。

功能与动机

PR的主要动机是将MOVA-360p视频生成模型集成到现有测试套件中，以验证其在不同GPU配置下的功能正确性。根据PR body描述，目标是'add support for testing the MOVA-360p video generation model'，这有助于确保新模型的稳定性和兼容性，为持续集成提供基础。

实现拆解

实现集中在两个文件：

test_utils.py：添加了常量DEFAULT_MOVA_360P_MODEL_NAME_FOR_TEST = "OpenMOSS-Team/MOVA-360p"，为测试提供模型路径。
testcase_configs.py：将常量添加到可用模型列表，并创建四个测试用例：
- 单GPU案例："mova_360p_1gpu"，使用DiffusionServerArgs配置单GPU和dit_layerwise_offload=True。
- 双GPU案例：三个案例分别配置tp_size=2、ring_degree=1, ulysses_degree=2和ring_degree=2, ulysses_degree=1，展示不同并行策略。
  所有案例均使用TI2V_sampling_params并设置run_perf_check=False。

评论区精华

review讨论主要围绕代码优化：

设计权衡：mickqian提问'could we reuse the existing sampling_params?'，CloudRipple回复已修复，最终改用TI2V_sampling_params，避免了冗余定义。
代码风格：gemini-code-assist[bot]建议'add a comment above this line to group this new model constant'并减少配置重复，前者已采纳（常量前添加了注释），后者未明确解决，提示未来维护风险。

风险与影响

风险：测试用例中DiffusionServerArgs配置存在重复（如review指出），可能增加未来更新成本；run_perf_check=False意味着未验证性能回归，但这是有意设置以减少CI开销。
影响：直接影响测试套件，无用户端变化；新增CI测试可能轻微延长运行时间，但提升了模型覆盖；团队需注意测试配置的标准化，以保持代码整洁。

关联脉络

从历史PR看，此PR与#21042（修改相同testcase_configs.py文件）和#20352（添加Hunyuan3D支持）相关，共同显示仓库在扩散模型测试和多模态生成能力上的持续扩展。近期PR如#21041（修复FLUX.1模型）也涉及扩散测试修复，表明这是一个活跃的演进领域。

#20430 [diffusion][CI] Add CI for MOVA model inference

执行摘要

为 MOVA-360p 视频生成模型添加 CI 测试，覆盖单 GPU 和双 GPU 配置。

实现拆解

评论区精华

风险与影响

关联 Issue

未识别关联 Issue

完整报告

参与讨论