Prhub

#26963 [diffusion] Add Cosmos3 Nano T2V GPU test

原始 PR 作者 mickqian 合并时间 2026-06-03 15:42 文件变更 3 提交数 8 评论 2 代码增减 +238 / -3

执行摘要

添加 Cosmos3 Nano T2V 单 GPU 一致性测试

PR body 说明需要为 Cosmos3 Nano T2V 模型增加一个轻量级一致性测试,以覆盖该模型在 CI 中的正确性验证,并固定对应的 gt 数据集(ci-data PR #11)。

该 PR 属于常规测试补充,逻辑清晰,无争议,建议合并。若有后续 Cosmos3 系列优化 PR,应同步更新对应的测试基线与阈值。

讨论亮点

该 PR 没有 review 评论。仅包含一条自动消息提示 daily quota 耗尽,以及作者触发的 /tag-and-rerun-ci 命令。未发现实质性技术讨论。

实现拆解

  1. gpu_cases.py 中添加测试用例:在 T2V 用例列表末尾插入一个新的 DiffusionTestCase,名称为 "cosmos3_nano_t2v",指定模型路径 DEFAULT_COSMOS3_NANO_MODEL_NAME_FOR_TEST、模态 video、环境变量 SGLANG_DISABLE_COSMOS3_GUARDRAILS=1,采样参数包括 prompt、输出尺寸、帧数、推理步数等,并开启一致性检查、关闭性能检查与组件精度检查。
  2. perf_baselines.json 中补充性能基线:为 cosmos3_nano_t2v 添加了各阶段耗时、每步去噪时间、预期端到端时间等占位数据,同时补充了 estimated_full_test_time_s 字段供调度器估算测试时长。此外还补填了其他几个已有用例缺失的 estimated_full_test_time_s 字段(如 zimage_image_t2i_2_gpusqwen_image_edit_ti2i 等),并新增了 cosmos3_nano_t2iflux_2_t2i_customized_vae_path 等用例的基线。
  3. consistency_threshold.json 中添加一致性阈值:新增 "cosmos3_nano_t2v" 键,配置 clip 阈值 0.90、ssim 阈值 0.89、psnr 阈值 24.0、mean_abs_diff 阈值 10.0。
文件 模块 状态 重要度
python/sglang/multimodal_gen/test/server/gpu_cases.py GPU 用例 modified 4.98
python/sglang/multimodal_gen/test/server/perf_baselines.json 性能基线 modified 5.3
python/sglang/multimodal_gen/test/server/consistency_threshold.json 一致性阈值 modified 4.11

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

风险极低:变更仅涉及测试配置文件(JSON/Python),不触及任何核心推理或运行时逻辑。主要风险在于性能基线值和一致性阈值可能不准确,若环境差异导致测试误报,需后续微调阈值。此外,测试依赖外部 ci-data 仓库的 gt 数据,若 gt 数据更新或丢失可能导致测试失败。

影响范围仅限于 diffusion 测试套件中的 Cosmos3 Nano T2V 模型,新增一个轻量级一致性测试(约 4 步推理),预计增加约 65 秒的 CI 耗时。对用户无直接影响,对团队可提升该模型的回归覆盖信心。

测试依赖外部 ci-data 数据集 阈值可能需随环境微调

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论