# PR #22267 完整报告

- 仓库：`sgl-project/sglang`
- 标题：Move ring test to nightly
- 合并时间：2026-04-07 21:56
- 原文链接：http://prhub.com.cn/sgl-project/sglang/pull/22267

---

# 执行摘要

- 一句话：将 Ring-2.5-1T 模型测试从常规 CI 移至夜间测试套件，并添加软看门狗超时参数。
- 推荐动作：此 PR 变更简单，无需精读。值得关注的是 review 建议未被采纳，软看门狗配置可能无效，但鉴于这是测试配置调整，风险可控。建议后续如有类似测试迁移，可考虑采纳 review 建议以完善超时处理。

# 功能与动机

PR 正文未明确说明动机，但从代码变更和 review 讨论推断，主要目的是将耗时较长的 Ring-2.5-1T 模型测试（预估时间从 1000 秒增至 1800 秒）从常规 CI 流水线移至夜间测试套件，以减轻日常 CI 负载，避免阻塞快速反馈。关联 Issue 评论中触发测试失败也表明需要调整测试配置。

# 实现拆解

仅修改了一个测试文件：
1. 将 register_cuda_ci 的 suite 参数从 "stage-c-test-8-gpu-h200" 改为 "nightly-8-gpu-common"，并设置 nightly=True，将测试移至夜间套件。
2. 在测试启动参数列表中添加 "--soft-watchdog-timeout" 和 "1800"，与现有的 "--watchdog-timeout" 值相同。
3. 将预估测试时间 est_time 从 1000 秒调整为 1800 秒，反映实际耗时。

关键文件：
- `test/registered/8-gpu-models/test_ring_2_5_1t.py`（模块 测试基础设施）: 唯一修改的文件，包含测试套件迁移和超时参数调整，直接影响 CI 执行行为。

关键符号：register_cuda_ci, test_ring_2_5_1t


# 评论区精华

review 中仅有一条来自 gemini-code-assist[bot] 的评论，指出软看门狗超时应低于硬超时以实现预警功能，建议将值改为 1500。但 PR 作者未采纳该建议，直接合并了 PR，导致软超时与硬超时相同，失去预警意义。

- 软看门狗超时值设置 (design): PR 作者未采纳建议，保持软硬超时均为 1800，使软超时冗余。

# 风险与影响

- 风险：风险较低：
 1. 测试配置变更：将测试移至夜间套件可能延迟问题发现，但这是权衡 CI 速度的常规操作。
 2. 软看门狗配置不当：软超时与硬超时相同，无法提前预警，可能导致测试进程被直接终止而非优雅处理，但仅影响该特定测试。
 3. 缺少测试覆盖验证：未提及是否验证了夜间测试套件能正确运行此测试。
- 影响：影响范围有限：
 1. 对用户无直接影响，仅涉及内部测试基础设施。
 2. 对系统：减少常规 CI 流水线耗时，优化资源使用；但夜间测试失败可能较晚被发现。
 3. 对团队：开发者在日常 PR 中不再运行此测试，加快 CI 反馈；但需依赖夜间测试来监控该模型回归。
- 风险标记：配置不当 , 缺少测试验证

# 关联脉络

- PR #21669 [AMD] Add Qwen3.5-397B FP8 nightly perf benchmarks for MI30x and MI35x: 同样涉及夜间测试套件的使用，展示了项目中对耗时测试迁移到夜间执行的模式。
- PR #15236 [CI] Add consistency test in CI: 涉及 CI 测试配置调整，与本 PR 同属测试基础设施变更范畴。