Prhub

#38632 [CI] fix LM Eval Qwen3.5 Models (B200)

原始 PR 作者 ZJY0516 合并时间 2026-03-31 21:20 文件变更 1 提交数 1 评论 0 代码增减 +1 / -0

执行摘要

修复 Qwen3.5 模型在 GSM8K 评估中的 CI 失败,通过调整 max_num_seqs 参数。

根据 PR body 描述,CI 失败是因为 RuntimeError: 'max_num_seqs (1024) exceeds available Mamba cache blocks (600)...',这由 PR #38270 引入,需要修复以避免评估测试中断。

该 PR 变更机械简单,无需精读;工程师可关注作为配置调整的示例,但无复杂设计决策值得深入分析。

讨论亮点

review 中没有实质性讨论:gemini-code-assist[bot] 评论无反馈,ProExpertProg 直接批准,表明变更被接受且无争议。

实现拆解

实现非常简单:只修改了一个 YAML 配置文件 tests/evals/gsm8k/configs/Qwen3.5-397B-A17B-NVFP4-DEP2.yaml,在 server_args 中添加了 --max-num-seqs 512 参数,从而降低并发序列数以匹配 Mamba cache blocks 限制。

文件 模块 状态 重要度
tests/evals/gsm8k/configs/Qwen3.5-397B-A17B-NVFP4-DEP2.yaml 测试评估 modified 3.0

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

风险极低:变更仅涉及配置文件参数调整,不触及核心代码逻辑。但需确保新值 512 在后续测试中不会引入性能回归或与其他配置冲突,目前未见相关测试覆盖验证。

影响范围有限:仅针对 Qwen3.5-397B 模型的 GSM8K 评估测试,修复 CI 失败以提升测试稳定性;对用户功能、系统性能或团队工作流无直接影响。

配置调整影响特定测试

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论