Prhub

#21779 Reduce redundant speculative decoding CI tests

原始 PR 作者 Qiaolin-Yu 合并时间 2026-04-01 08:40 文件变更 2 提交数 6 评论 9 代码增减 +42 / -302

执行摘要

移除 EAGLE 推测解码测试中的冗余用例,显著缩短 CI 执行时间。

根据PR body,动机是“Reduce EAGLE test CI time by removing redundant/duplicate test cases.” 具体提到在test_eagle_infer_a.py中移除TestEAGLERadixCache(已在server-mode测试覆盖)和TestEAGLEDraftExtend(在CI中被跳过),并在test_eagle_infer_b.py中提取TestEAGLEServerBasic以减少配置变体的重复测试。

该PR对CI优化有价值,值得快速浏览以理解测试套件结构改进,如冗余测试识别和核心测试提取逻辑,但无需深入代码细节。

讨论亮点

由于review评论为空,没有实质技术讨论。Issue评论中仅显示作者多次使用/rerun-test命令验证CI通过(如测试文件test_eagle_infer_b.pytest_eagle_infer_a.py),表明变更后测试执行正常,无争议点。

实现拆解

变更集中在两个测试文件:1) test_eagle_infer_a.py:删除TestEAGLERadixCache类和TestEAGLEDraftExtend系列类,减少265行代码,并将register_cuda_ciest_time从561秒下调至250秒;2) test_eagle_infer_b.py:提取TestEAGLEServerBasic类为核心测试基类,仅保留test_gsm8ktest_request_abort方法,合并TestEAGLEServerPageSizeTopkFA3TestEAGLEServerExtendest_time从1100秒减少至600秒。

文件 模块 状态 重要度
test/registered/spec/eagle/test_eagle_infer_a.py 测试 /spec/eagle modified 5.0
test/registered/spec/eagle/test_eagle_infer_b.py 测试 /spec/eagle modified 5.0

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

关键符号

TestEAGLERadixCache TestEAGLEDraftExtend TestEAGLEServerBasic TestEAGLEServerPageSizeTopkFA3

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

主要风险是测试覆盖率可能降低,因为移除了冗余但可能捕捉边缘情况的测试(如TestEAGLERadixCache中的多配置测试)。合并类可能隐藏特定配置的错误,但作者声称已在server-mode测试覆盖,且CI通过表明基本功能未受影响。

对用户无直接影响,因为变更仅涉及CI测试。对系统:减少CI资源消耗和时间约50%,提升开发效率。对团队:加速CI流水线,可能降低维护成本,但需监控测试覆盖度以确保质量。

测试覆盖率降低 潜在回归风险

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

执行摘要

本次PR通过移除EAGLE推测解码测试中的冗余用例,将预估CI执行时间从1661秒减少至850秒,旨在加速CI流水线,变更仅影响测试文件,对核心功能无直接影响。

功能与动机

动机是减少EAGLE测试的CI执行时间,移除重复和跳过的测试用例。PR body中明确说明:"Reduce EAGLE test CI time by removing redundant/duplicate test cases." 具体目标包括删除已被覆盖的TestEAGLERadixCache(已在server-mode测试中覆盖)和跳过的TestEAGLEDraftExtend类,并重构服务器测试以减少重复执行。

实现拆解

变更涉及两个测试文件:

  • test_eagle_infer_a.py:删除TestEAGLERadixCache类(包含多配置测试)和TestEAGLEDraftExtend系列类,减少265行代码,将register_cuda_ciest_time从561秒下调至250秒。
  • test_eagle_infer_b.py:提取TestEAGLEServerBasic类为核心测试基类,仅保留test_gsm8ktest_request_abort方法;合并TestEAGLEServerPageSizeTopkFA3TestEAGLEServerExtendest_time从1100秒减少至600秒。

评论区精华

由于review评论为空,无实质性技术讨论。Issue评论中作者多次使用/rerun-test命令验证CI通过(如test_eagle_infer_b.pytest_eagle_infer_a.py),表明变更后测试执行正常,无争议或设计权衡。

风险与影响

风险:测试覆盖率可能降低,移除的冗余测试(如TestEAGLERadixCache中的多配置测试)或许捕捉边缘情况;合并类可能掩盖特定配置错误。影响:对用户无感知;系统CI时间减半,提升开发效率;团队需监控测试有效性以确保质量。

关联脉络

与近期PR如#21554(移除冗余PCG测试)和#21787(移除冗余MoE测试)一脉相承,反映团队持续优化CI测试套件以减少冗余、提升效率的趋势,属于测试维护和CI性能改进的常规工作。

参与讨论