Prhub

#21779 Reduce redundant speculative decoding CI tests

原始 PR 作者 Qiaolin-Yu 合并时间 2026-04-01 08:40 文件变更 2 提交数 6 评论 9 代码增减 +42 / -302

执行摘要

移除 EAGLE 推测解码测试中的冗余用例,显著缩短 CI 执行时间。

根据PR body,动机是“Reduce EAGLE test CI time by removing redundant/duplicate test cases.” 具体提到在test_eagle_infer_a.py中移除TestEAGLERadixCache(已在server-mode测试覆盖)和TestEAGLEDraftExtend(在CI中被跳过),并在test_eagle_infer_b.py中提取TestEAGLEServerBasic以减少配置变体的重复测试。

该PR对CI优化有价值,值得快速浏览以理解测试套件结构改进,如冗余测试识别和核心测试提取逻辑,但无需深入代码细节。

讨论亮点

由于review评论为空,没有实质技术讨论。Issue评论中仅显示作者多次使用/rerun-test命令验证CI通过(如测试文件test_eagle_infer_b.pytest_eagle_infer_a.py),表明变更后测试执行正常,无争议点。

实现拆解

变更集中在两个测试文件:

1) test_eagle_infer_a.py:删除TestEAGLERadixCache类和TestEAGLEDraftExtend系列类,减少265行代码,并将register_cuda_ciest_time从561秒下调至250秒;
2) test_eagle_infer_b.py:提取TestEAGLEServerBasic类为核心测试基类,仅保留test_gsm8ktest_request_abort方法,合并TestEAGLEServerPageSizeTopkFA3TestEAGLEServerExtendest_time从1100秒减少至600秒。

文件 模块 状态 重要度
test/registered/spec/eagle/test_eagle_infer_a.py 测试 /spec/eagle modified 5.0
test/registered/spec/eagle/test_eagle_infer_b.py 测试 /spec/eagle modified 5.0

关键符号

TestEAGLERadixCache TestEAGLEDraftExtend TestEAGLEServerBasic TestEAGLEServerPageSizeTopkFA3

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

主要风险是测试覆盖率可能降低,因为移除了冗余但可能捕捉边缘情况的测试(如TestEAGLERadixCache中的多配置测试)。合并类可能隐藏特定配置的错误,但作者声称已在server-mode测试覆盖,且CI通过表明基本功能未受影响。

对用户无直接影响,因为变更仅涉及CI测试。对系统:减少CI资源消耗和时间约50%,提升开发效率。对团队:加速CI流水线,可能降低维护成本,但需监控测试覆盖度以确保质量。

测试覆盖率降低 潜在回归风险

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论