Prhub

sgl-project/sglang · 标签视图

标签列表

聚合结果

cuda-graph 相关 PR

2026-05-28
缺陷修复 重要性 5.60 洞察度 5.00

修复 GemmaRMSNorm buffer 存储导致 CUDA Graph 失效

这是一个值得精读的微型实例:演示了 PyTorch 中 `=` 赋值与原地操作在 CUDA Graph 上下文下的关键区别。团队可借鉴此模式审查其他存在 `buffer = expr` 赋值且参与 CUDA Graph 捕获的模块。