# PR #22418 完整报告

- 仓库：`sgl-project/sglang`
- 标题：Move runai model loader test to nightly suite
- 合并时间：2026-04-09 12:39
- 原文链接：http://prhub.com.cn/sgl-project/sglang/pull/22418

---

# 执行摘要

- 一句话：将 Runai 模型加载测试从 PR CI 移至夜间测试套件，解决慢速和稳定性问题。
- 推荐动作：该 PR 变更直接，适合快速浏览以了解 CI 测试套件调整策略。值得关注的是如何将慢速、不稳定的测试从 PR CI 移至夜间测试的决策，这对优化 CI 流水线有参考价值。无需深入代码细节。

# 功能与动机

PR body 中明确指出：测试通过 Runai Model Streamer 从 GCS 下载模型，速度慢（平均约 380 秒）且不稳定（在 libstreamer.so 中等待信号量时可能挂起），不适合在每次 PR 的 CI 中运行。因此需要将其移至夜间测试套件，避免影响 PR CI 的效率和可靠性。

# 实现拆解

变更涉及三个文件：1) 在 .github/workflows/nightly-test-nvidia.yml 中为 nightly-1-gpu 测试任务添加 RUNAI_STREAMER_MEMORY_LIMIT: 0 环境变量；2) 在 .github/workflows/pr-test.yml 中从 stage-b-test-1-gpu-small 任务移除该环境变量；3) 在 test/registered/model_loading/test_runai_model_loader.py 中更新测试注册信息，将 suite 从 stage-b-test-1-gpu-small 改为 nightly-1-gpu，并设置 nightly=True，同时将预估时间从 120 秒调整为 380 秒。

关键文件：
- `test/registered/model_loading/test_runai_model_loader.py`（模块 测试注册）: 核心变更文件，将测试从 PR CI 套件移至夜间套件，并更新预估时间
- `.github/workflows/nightly-test-nvidia.yml`（模块 CI 工作流）: 为夜间测试套件添加环境变量配置，确保测试能正常运行
- `.github/workflows/pr-test.yml`（模块 CI 工作流）: 移除 PR CI 套件中的环境变量，避免配置残留

关键符号：register_cuda_ci


# 评论区精华

本次 PR 没有 review 评论，所有变更由作者 hnyls2002 直接提交并合并。从提交历史看，作者在第一个提交中移动测试并更新环境变量，第二个提交专门移除 pr-test.yml 中的环境变量，显示了对 CI 配置的细致调整。

- 暂无高价值评论线程

# 风险与影响

- 风险：风险较低，主要涉及 CI 配置调整：1) 测试移动后，Runai 模型加载功能在 PR CI 中不再被验证，可能引入未被及时发现的回归问题；2) 环境变量 RUNAI_STREAMER_MEMORY_LIMIT 的调整如果未正确同步，可能导致测试在夜间套件中失败；3) 测试预估时间从 120 秒改为 380 秒，若实际耗时更长可能影响夜间测试的整体时长。
- 影响：对用户和系统无直接影响。对团队的影响：1) PR CI 的 stage-b-test-1-gpu-small 套件运行时间缩短，提升 CI 效率；2) 夜间测试套件增加一个慢速测试，可能延长夜间测试时间；3) 减少了因 Runai 测试不稳定导致的 CI 失败，提高开发体验。
- 风险标记：测试覆盖减少 , 环境变量配置风险

# 关联脉络

- PR #22399 [CI] Add GLM-5.1 nightly tests and update Qwen3.5 model: 同样涉及夜间测试套件的扩展，展示了 CI 测试策略的演进
- PR #22395 [CI] Increase stage-c-test-4-gpu-b200 partitions from 4 to 5: 同属 CI 优化类 PR，通过调整测试分区解决超时问题
- PR #22308 [CI] Add pre-commit hook to validate test/registered/ files have CI registry: 涉及 test/registered/ 目录的测试注册管理，与本 PR 的测试移动相关