Prhub

#24219 [diffusion] CI: change ground truth repo

原始 PR 作者 mickqian 合并时间 2026-05-02 12:25 文件变更 4 提交数 1 评论 1 代码增减 +11 / -11

执行摘要

切换扩散 CI ground truth 数据源仓库

统一 CI 数据管理仓库,将 ground truth 数据从个人/机器人仓库迁移至组织级仓库 sgl-project/ci-data,提升可维护性和权限管理一致性。

变更简单直接,但建议确认 sgl-project/ci-data 仓库已包含所需数据且 CI 测试通过。对于了解项目 CI 基础设施演进的读者有一定参考价值。

讨论亮点

代码审查 bot(gemini-code-assist[bot])提出了一条自动生成的 review,指出该 PR 还涉及 torch 和 sglang-kernel 升级等无关内容(可能是混淆),但实际 diff 仅为仓库迁移。无其他讨论。

实现拆解

  1. 更新测试常量:在 test_utils.py 中将 SGL_TEST_FILES_OFFICIAL_CONSISTENCY_GT_BASESGL_TEST_FILES_SGLANG_CONSISTENCY_GT_BASE 的 URL 中的 sglang-bot/sglang-ci-data 替换为 sgl-project/ci-data
  2. 更新测试错误提示:在 test_server_common.py_validate_consistency 函数中,将缺失 ground truth 时的错误提示中的仓库名称从 sglang-bot/sglang-ci-data 改为 sgl-project/ci-data
  3. 更新 CI 工作流:在 diffusion-ci-gt-gen.yml 中,将 job 名称和描述中的 sglang-bot/sglang-ci-data 替换为 sgl-project/ci-data
  4. 更新发布脚本:在 publish_diffusion_gt.py 中,将 REPO_OWNERREPO_NAMEsglang-botsglang-ci-data 改为 sgl-projectci-data,并更新模块文档字符串。
文件 模块 状态 重要度
python/sglang/multimodal_gen/test/test_utils.py 测试工具 modified 3.99
python/sglang/multimodal_gen/test/server/test_server_common.py 测试用例 modified 3.99
.github/workflows/diffusion-ci-gt-gen.yml CI 工作流 modified 3.55
scripts/ci/utils/diffusion/publish_diffusion_gt.py CI 脚本 modified 3.41

关键源码片段

python/sglang/multimodal_gen/test/test_utils.py test-coverage

定义 ground truth URL 常量,变更后测试将指向新仓库。

# 之前 : sglang-bot/sglang-ci-data
# 之后 : sgl-project/ci-data
SGL_TEST_FILES_OFFICIAL_CONSISTENCY_GT_BASE = "https://raw.githubusercontent.com/sgl-project/ci-data/main/diffusion-ci/consistency_gt/official_generated"
SGL_TEST_FILES_SGLANG_CONSISTENCY_GT_BASE = "https://raw.githubusercontent.com/sgl-project/ci-data/main/diffusion-ci/consistency_gt/sglang_generated"
SGL_TEST_FILES_CONSISTENCY_GT_BASE = SGL_TEST_FILES_SGLANG_CONSISTENCY_GT_BASE
SGL_TEST_FILES_CONSISTENCY_GT_BASES = (
    SGL_TEST_FILES_OFFICIAL_CONSISTENCY_GT_BASE,
    SGL_TEST_FILES_SGLANG_CONSISTENCY_GT_BASE,
)

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

低风险。变更仅为字符串替换,不涉及逻辑改动。但若新仓库 sgl-project/ci-data 中 ground truth 数据未及时同步或路径结构不同,可能导致 CI 一致性测试失败。需确保迁移后数据可用且路径一致。

影响扩散模型的一致性测试流程(test_server_common.py 和 test_utils.py),CI 工作流(diffusion-ci-gt-gen.yml)和发布脚本(publish_diffusion_gt.py)。仅对使用这些测试和 CI 流程的开发者有影响,核心产品代码不受影响。

外部依赖仓库变更

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论