#38083 [Bugfix] Fix DeepGemm E8M0 accuracy degradation for Qwen3.5 FP8 on Blackwell
原始 PR · 作者 vadiklyutiy · 合并时间 2026-03-26 16:21
修复 Qwen3.5 FP8 在 Blackwell 上 DeepGemm 精度下降
值得精读,尤其关注配置层 `use_deep_gemm` 的三态设计与自动禁用机制的权衡。review 中提出的覆盖失败和虚假日志问题需后续 PR 修复,可作为实践参考。
参与讨论