Prhub

#20430 [diffusion][CI] Add CI for MOVA model inference

sgl-project/sglang · 作者 CloudRipple · 合并时间 2026-03-25 02:28

分析状态 已生成
文件变更 2提交数 10 · 评论 38
代码增减 +54 / -0
ci test diffusion feature

执行摘要

为 MOVA-360p 视频生成模型添加 CI 测试,覆盖单 GPU 和双 GPU 配置。

根据PR body描述,动机是'add support for testing the MOVA-360p video generation model in the multimodal generation test suite',目的是为新的视频生成模型提供持续集成测试,确保其在不同硬件配置下的稳定性和兼容性。

该PR值得快速浏览以了解新模型集成到测试套件的模式。重点关注如何重用现有sampling_params避免冗余定义,以及测试用例中不同并行配置(如tp_size、ring_degree)的设计,这对理解扩散模型测试框架有参考价值。

讨论亮点

review中,gemini-code-assist[bot]建议为模型常量添加分组注释并减少测试用例中DiffusionServerArgs的重复配置,但未明确是否采纳;mickqian询问'could we reuse the existing sampling_params?',CloudRipple回复'ok, we fixed this',commit历史显示后续将MOVA_I2V_360P_sampling_params替换为TI2V_sampling_params,体现了对设计优化的响应。讨论聚焦于代码组织、重用性和维护性。

实现拆解

实现主要涉及两个文件:在python/sglang/multimodal_gen/test/test_utils.py中添加DEFAULT_MOVA_360P_MODEL_NAME_FOR_TEST常量;在python/sglang/multimodal_gen/test/server/testcase_configs.py中,将该常量添加到可用模型列表,并创建四个DiffusionTestCase实例:一个单GPU案例('mova_360p_1gpu')和三个双GPU案例('mova_360p_tp2'、'mova_360p_ring1_uly2'、'mova_360p_ring2_uly1'),使用现有的TI2V_sampling_params并设置run_perf_check=False以避免性能检查。

文件 模块 状态 重要度
python/sglang/multimodal_gen/test/server/testcase_configs.py multimodal_gen test server modified 7.0
python/sglang/multimodal_gen/test/test_utils.py multimodal_gen test utils modified 5.0

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

重用现有 sampling_params 设计

mickqian 询问 'could we reuse the existing sampling_params?',CloudRipple 回复已修复,commit 显示改用 TI2V_sampling_params。

结论:采纳建议,避免重复定义,使用现有的 TI2V_sampling_params。 · 已解决

代码重复和注释改进 style

gemini-code-assist[bot] 建议为模型常量添加分组注释和减少 DiffusionServerArgs 的重复配置以提高可维护性。

结论:未在材料中明确是否采纳,但常量注释已添加(如 PR body 提到 '# MOVA video generation models')。 · partially resolved

风险与影响

风险较低,主要集中在测试代码的维护性:测试用例中的DiffusionServerArgs配置存在重复(如review指出),可能导致未来更新困难;测试未启用性能检查(run_perf_check=False),可能遗漏性能回归验证;但变更范围限于测试套件,不影响核心业务逻辑,回归风险小。

影响范围有限,主要针对测试基础设施:用户无直接影响,但工程师在维护多模态生成测试时需处理新模型配置;系统上,新增CI测试可能略微增加CI运行时间,但增强了模型覆盖;团队需关注测试用例的配置模式以保持一致性。

代码重复 缺少性能测试

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

执行摘要

此PR为MOVA-360p视频生成模型添加了CI测试,通过定义模型常量和配置多个测试用例(单GPU和双GPU),扩展了多模态生成测试套件的覆盖范围。变更简单且风险低,但review中讨论了代码组织和重用性问题,建议关注测试配置的设计模式。

功能与动机

PR的主要动机是将MOVA-360p视频生成模型集成到现有测试套件中,以验证其在不同GPU配置下的功能正确性。根据PR body描述,目标是'add support for testing the MOVA-360p video generation model',这有助于确保新模型的稳定性和兼容性,为持续集成提供基础。

实现拆解

实现集中在两个文件:

  • test_utils.py:添加了常量DEFAULT_MOVA_360P_MODEL_NAME_FOR_TEST = "OpenMOSS-Team/MOVA-360p",为测试提供模型路径。
  • testcase_configs.py:将常量添加到可用模型列表,并创建四个测试用例:
    • 单GPU案例:"mova_360p_1gpu",使用DiffusionServerArgs配置单GPU和dit_layerwise_offload=True
    • 双GPU案例:三个案例分别配置tp_size=2ring_degree=1, ulysses_degree=2ring_degree=2, ulysses_degree=1,展示不同并行策略。
      所有案例均使用TI2V_sampling_params并设置run_perf_check=False

评论区精华

review讨论主要围绕代码优化:

  • 设计权衡:mickqian提问'could we reuse the existing sampling_params?',CloudRipple回复已修复,最终改用TI2V_sampling_params,避免了冗余定义。
  • 代码风格:gemini-code-assist[bot]建议'add a comment above this line to group this new model constant'并减少配置重复,前者已采纳(常量前添加了注释),后者未明确解决,提示未来维护风险。

风险与影响

风险:测试用例中DiffusionServerArgs配置存在重复(如review指出),可能增加未来更新成本;run_perf_check=False意味着未验证性能回归,但这是有意设置以减少CI开销。
影响:直接影响测试套件,无用户端变化;新增CI测试可能轻微延长运行时间,但提升了模型覆盖;团队需注意测试配置的标准化,以保持代码整洁。

关联脉络

从历史PR看,此PR与#21042(修改相同testcase_configs.py文件)和#20352(添加Hunyuan3D支持)相关,共同显示仓库在扩散模型测试和多模态生成能力上的持续扩展。近期PR如#21041(修复FLUX.1模型)也涉及扩散测试修复,表明这是一个活跃的演进领域。

参与讨论