#22194 [Qwen3-Specv2]: Fix flaky ci

原始 PR 作者 hzh0425 合并时间 2026-04-07 00:40 文件变更 1 提交数 1 评论 3 代码增减 +1 / -1

执行摘要

提高 Qwen3 Next MTP V2 测试的 KL 散度阈值以修复 CI 不稳定性。

根据PR标题和Issue评论，此变更旨在修复CI测试的间歇性失败（flaky ci）。评论中ispobock指出这是为了修复一个特定的CI运行失败（链接指向一个失败的测试步骤）。

此PR无需精读，除非您负责Qwen3 Next MTP测试维护。关注点：阈值调整是否合理（从0.0025到0.0035的增量是否基于数据驱动决策）。

讨论亮点

review讨论非常有限。gemini-code-assist[bot]的评论仅描述了变更内容（“放宽了模型评估的KL散度阈值”），没有提出任何问题或建议。ispobock直接批准，没有额外评论。

实现拆解

仅修改了一个测试文件：将test/registered/4-gpu-models/test_qwen3_next_models_mtp.py中TestQwen3NextMTPV2类的kl_div_thres属性从0.0025调整为0.0035。

文件	模块	状态	重要度
`test/registered/4-gpu-models/test_qwen3_next_models_mtp.py`	测试	modified	3.0

分析完成后，这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

KL 散度阈值调整 测试

gemini-code-assist[bot] 指出此变更“放宽了 KL 散度阈值”，但未引发进一步讨论。

结论：变更被接受，无争议。 · 已解决

风险与影响

风险极低：

仅修改测试阈值，不涉及生产代码，无回归风险。
提高阈值可能掩盖模型输出的微小退化，但这是测试策略权衡，而非技术风险。
变更范围极小（单行修改），易于验证。

影响有限：

对用户：无直接影响。
对系统：提高测试通过率，减少CI噪声。
对团队：简化维护，但需注意阈值调整可能降低测试严格度。

测试严格度降低

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接，后续同步到相关引用后会出现在这里。

完整报告

执行摘要

一句话：提高Qwen3 Next MTP V2测试的KL散度阈值以修复CI不稳定性。
推荐动作：此PR无需精读，除非您负责Qwen3 Next MTP测试维护。关注点：阈值调整是否合理（从0.0025到0.0035的增量是否基于数据驱动决策）。

功能与动机

实现拆解

仅修改了一个测试文件：将test/registered/4-gpu-models/test_qwen3_next_models_mtp.py中TestQwen3NextMTPV2类的kl_div_thres属性从0.0025调整为0.0035。

关键文件：

test/registered/4-gpu-models/test_qwen3_next_models_mtp.py（模块测试）: 唯一被修改的文件，包含Qwen3 Next MTP V2测试的KL散度阈值调整。

关键符号：未识别

评论区精华

KL散度阈值调整 (testing): 变更被接受，无争议。

风险与影响

风险：风险极低：
1. 仅修改测试阈值，不涉及生产代码，无回归风险。
2. 提高阈值可能掩盖模型输出的微小退化，但这是测试策略权衡，而非技术风险。
3. 变更范围极小（单行修改），易于验证。
影响：影响有限：
1. 对用户：无直接影响。
2. 对系统：提高测试通过率，减少CI噪声。
3. 对团队：简化维护，但需注意阈值调整可能降低测试严格度。
  - 风险标记：测试严格度降低

关联脉络

PR #22190 Update test coverage report: 同属测试/CI优化类别，关注测试稳定性和报告改进。
PR #22176 Fix ut module importing: 同属修复测试问题的PR，涉及测试环境依赖和导入机制。
PR #22170 fix hisparse LRU policy: 同属修复CI问题的PR（标签包含run-ci），但涉及核心JIT内核bugfix，而本PR仅调整测试阈值。

#22194 [Qwen3-Specv2]: Fix flaky ci

执行摘要

提高 Qwen3 Next MTP V2 测试的 KL 散度阈值以修复 CI 不稳定性。

实现拆解

评论区精华

风险与影响

关联 Issue

未识别关联 Issue

完整报告

参与讨论