Prhub

#21485 Remove redundant DeepSeek V3 FP4 PCG test

原始 PR 作者 mmangkad 合并时间 2026-03-27 12:52 文件变更 1 提交数 1 评论 2 代码增减 +1 / -67

执行摘要

删除 DeepSeek V3 FP4 冗余 PCG 测试,优化 CI 执行时间。

PR body 中说明:'PCG is now enabled by default. TestDeepseekV3FP4PiecewiseCudaGraph runs the exact same config as TestDeepseekV3FP4 (both use default PCG) and is wasting CI time and resources.' 目的是清理冗余测试,减少 CI 资源浪费,提升测试流水线的执行效率。

该 PR 变更简单直接,值得快速浏览以了解测试清理和 CI 优化实践,无需深入精读。

讨论亮点

review 中仅有的讨论是关于代码风格优化:gemini-code-assist[bot] 建议将未使用的变量 acc_length 用 '_' 替换以明确忽略('The acc_length variable is assigned but not used. It's good practice to use _ for unused variables'),作者 mmangkad 回复 'That's literally what the PR does',表示变更已包含此改进。无争议,讨论已闭合。

实现拆解

主要修改文件 test/registered/quant/test_deepseek_v3_fp4_4gpu.py:

  1. 删除 TestDeepseekV3FP4PiecewiseCudaGraph 类及其所有方法(包括 test_a_gsm8k 和 test_bs_1_speed)。
  2. 调整 register_cuda_ci 的 est_time 参数从 1500 降至 1200,以更准确反映测试执行时间。
  3. 在保留的 TestDeepseekV3FP4.test_bs_1_speed 方法中,将未使用的变量 acc_length 替换为 '_',优化代码风格。
文件 模块 状态 重要度
test/registered/quant/test_deepseek_v3_fp4_4gpu.py 量化测试 modified 5.0

关键符号

TestDeepseekV3FP4PiecewiseCudaGraph.test_a_gsm8k TestDeepseekV3FP4PiecewiseCudaGraph.test_bs_1_speed TestDeepseekV3FP4.test_bs_1_speed

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

未使用变量命名优化 style

gemini-code-assist[bot] 建议将 acc_length 变量替换为 '_' 以明确忽略,作者 mmangkad 确认 PR 已包含此变更。

结论:无争议,变更已实施。 · 已解决

风险与影响

风险较低:

  1. 删除测试可能影响覆盖度,但由于 PR 指出测试是冗余的(PCG 默认启用,配置相同),实际测试覆盖度应保持不变。
  2. 减少估计时间从 1500 秒到 1200 秒可能增加 CI 超时风险,但这是基于测试实际执行时间的优化,且变更小,风险可控。

对用户无直接影响;对系统:CI 执行时间减少,资源使用更高效;对团队:提升 CI 效率,减少等待时间,加快测试反馈循环。

删除冗余测试 CI 超时风险低

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论