#22210 [CI] Relax transformers MMLU threshold from 0.65 to 0.64
原始 PR · 作者 alisonshao · 合并时间 2026-04-07 06:32
降低Transformers模型MMLU测试阈值从0.65到0.64,解决CI不稳定性问题。
这是一个简单的测试配置调整PR,无需深入阅读。值得关注的点是:这是典型的CI稳定性维护操作,反映了团队对测试flakiness的快速响应。建议后续关注相关模型的MMLU分数趋势,确保阈值调整不会掩盖真正的性能回归。
参与讨论