执行摘要
将 flashinfer-cubin 设为默认 CUDA 依赖,以支持 Blackwell 部署。
PR body 中指出:'Since we rely on cubins now for most Blackwell deployments, it makes sense to consider making flashinfer-cubin a default package.' 主要动机是适配 Blackwell 部署需求,默认包含该依赖以减少额外安装步骤,同时权衡了约 250MB 的镜像体积影响。
建议负责 CUDA 部署或基础设施维护的工程师精读此 PR,重点关注版本管理策略。变更设计简单,但凸显了依赖分散管理的风险,值得作为案例讨论统一版本控制的最佳实践。
review 中唯一评论来自 gemini-code-assist[bot],重点关注版本管理风险:'Hardcoding the version 0.6.6 here makes the dependency management fragile. ... If FLASHINFER_VERSION is updated in the Dockerfile or overridden during a build, flashinfer-cubin will have a mismatched version, which can lead to runtime failures.' 评论建议采用单一事实源管理版本,但 PR 已合并,未进一步讨论或解决此疑虑。
参与讨论