Prhub

#42991 [CI/Build] Bump nvidia-cutlass-dsl to 4.5.1

原始 PR 作者 arpera 合并时间 2026-05-19 07:58 文件变更 1 提交数 1 评论 0 代码增减 +1 / -1

执行摘要

bump cutlass-dsl 至 4.5.1 修复 Blackwell GDN ICE

原 pin 的 4.5.0 版本在 Blackwell GPU 上运行 FlashInfer GDN prefill kernel 时触发 JIT compile ICE(内部编译器错误)。升级至 4.5.1 后相关测试全部通过(1563 passed, 0 failed),修复了 GDN 功能的阻碍。

建议快速合并。PR 简单、测试充分、风险低,修复了明确的 JIT 编译崩溃问题。

讨论亮点

无实质性讨论,review 仅为自动机器人和两个 approve。

实现拆解

  1. 修改依赖版本:在 requirements/cuda.txt 中将 nvidia-cutlass-dsl[cu13]==4.5.0 改为 ==4.5.1
  2. 无其他代码变更:只需调整依赖版本号,无需修改 Python 或 CUDA 源码。
文件 模块 状态 重要度
requirements/cuda.txt 依赖管理 modified 2.52

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

低风险。仅依赖版本号变化,无 API 或行为变更。如果 4.5.1 引入回归,会导致 GDN 相关测试失败或运行时错误,但 cutlass-dsl 从 4.5.0 到 4.5.1 是小版本修复,兼容性有保障。

影响仅限使用 NVIDIA Blackwell GPU(如 GB200)且启用 FlashInfer GDN 预填充内核的用户。修复了之前可能出现的 JIT 编译崩溃,使 GDN 功能正常可用。对非 Blackwell 或其他功能无影响。

依赖版本号变更 仅影响 Blackwell GDN 场景

关联 Issue

#42342 [Bug] Fix DeepSeek V4 `AttributeError: module 'cutlass.cute.nvgpu' has no attribute 'LoadCacheMode'`

完整报告

参与讨论