Profile vision encoder CUDA graph pool memory
此 PR 值得精读,尤其关注 `profile_cudagraph_memory` 中如何集成 encoder 部分以及 graph pool 的生命周期设计。它展示了在已有的 CUDA graph 框架中扩展新模块的典型模式:通过临时 manager 进行 profile,通过持久 manager 进行 runtime,并利用 graph pool 隔离。对多模态模型开发者和 CUDA graph 维护者有重要参考价值。