执行摘要
- 一句话:切换扩散 CI ground truth 数据源仓库
- 推荐动作:变更简单直接,但建议确认 sgl-project/ci-data 仓库已包含所需数据且 CI 测试通过。对于了解项目 CI 基础设施演进的读者有一定参考价值。
功能与动机
统一 CI 数据管理仓库,将 ground truth 数据从个人/机器人仓库迁移至组织级仓库 sgl-project/ci-data,提升可维护性和权限管理一致性。
实现拆解
- 更新测试常量:在
test_utils.py 中将 SGL_TEST_FILES_OFFICIAL_CONSISTENCY_GT_BASE 和 SGL_TEST_FILES_SGLANG_CONSISTENCY_GT_BASE 的 URL 中的 sglang-bot/sglang-ci-data 替换为 sgl-project/ci-data。
- 更新测试错误提示:在
test_server_common.py 的 _validate_consistency 函数中,将缺失 ground truth 时的错误提示中的仓库名称从 sglang-bot/sglang-ci-data 改为 sgl-project/ci-data。
- 更新 CI 工作流:在
diffusion-ci-gt-gen.yml 中,将 job 名称和描述中的 sglang-bot/sglang-ci-data 替换为 sgl-project/ci-data。
- 更新发布脚本:在
publish_diffusion_gt.py 中,将 REPO_OWNER 和 REPO_NAME 从 sglang-bot 和 sglang-ci-data 改为 sgl-project 和 ci-data,并更新模块文档字符串。
关键文件:
python/sglang/multimodal_gen/test/test_utils.py(模块 测试工具;类别 test;类型 test-coverage): 定义 ground truth URL 常量,变更后测试将指向新仓库。
python/sglang/multimodal_gen/test/server/test_server_common.py(模块 测试用例;类别 test;类型 test-coverage): 更新缺失 ground truth 时的错误提示消息中的仓库引用。
.github/workflows/diffusion-ci-gt-gen.yml(模块 CI 工作流;类别 infra;类型 infrastructure): CI 工作流配置文件,更新了 job 名称和描述中的仓库引用。
scripts/ci/utils/diffusion/publish_diffusion_gt.py(模块 CI 脚本;类别 infra;类型 infrastructure): GT 发布脚本,更新了仓库所有权和名称常量。
关键符号:未识别
关键源码片段
python/sglang/multimodal_gen/test/test_utils.py
定义 ground truth URL 常量,变更后测试将指向新仓库。
# 之前 : sglang-bot/sglang-ci-data
# 之后 : sgl-project/ci-data
SGL_TEST_FILES_OFFICIAL_CONSISTENCY_GT_BASE = "https://raw.githubusercontent.com/sgl-project/ci-data/main/diffusion-ci/consistency_gt/official_generated"
SGL_TEST_FILES_SGLANG_CONSISTENCY_GT_BASE = "https://raw.githubusercontent.com/sgl-project/ci-data/main/diffusion-ci/consistency_gt/sglang_generated"
SGL_TEST_FILES_CONSISTENCY_GT_BASE = SGL_TEST_FILES_SGLANG_CONSISTENCY_GT_BASE
SGL_TEST_FILES_CONSISTENCY_GT_BASES = (
SGL_TEST_FILES_OFFICIAL_CONSISTENCY_GT_BASE,
SGL_TEST_FILES_SGLANG_CONSISTENCY_GT_BASE,
)
评论区精华
代码审查 bot(gemini-code-assist[bot])提出了一条自动生成的 review,指出该 PR 还涉及 torch 和 sglang-kernel 升级等无关内容(可能是混淆),但实际 diff 仅为仓库迁移。无其他讨论。
风险与影响
- 风险:低风险。变更仅为字符串替换,不涉及逻辑改动。但若新仓库
sgl-project/ci-data 中 ground truth 数据未及时同步或路径结构不同,可能导致 CI 一致性测试失败。需确保迁移后数据可用且路径一致。
- 影响:影响扩散模型的一致性测试流程(test_server_common.py 和 test_utils.py),CI 工作流(diffusion-ci-gt-gen.yml)和发布脚本(publish_diffusion_gt.py)。仅对使用这些测试和 CI 流程的开发者有影响,核心产品代码不受影响。
- 风险标记:外部依赖仓库变更
关联脉络
参与讨论