#38423 [NVIDIA] Bugfix NVFP4 DGX Spark and RTX50
原始 PR · 作者 johnnynunez · 合并时间 2026-03-31 00:36
修复SM12x GPU上NVFP4模型的非法指令错误,通过升级CUTLASS和添加运行时守卫。
该PR值得精读,特别是对于从事量化或硬件支持开发的工程师。关注的设计决策包括:运行时SM守卫的实现方式、依赖版本管理策略(如CUTLASS升级到v4.4.2解决tile约束)、以及后端选择逻辑的优化以确保安全回退。建议结合Issue评论中的SMEM溢出问题,评估长期解决方案。
参与讨论