#5596 [docker] feat: Add GB200 (aarch64/Blackwell) Docker image and training example
作者 kaixih · 合并时间 2026-04-10 11:23
为GB200(aarch64/Blackwell)添加Docker镜像和训练示例,扩展硬件支持并适配测试。
建议技术管理者和工程师精读此PR,重点关注Dockerfile多架构设计决策(如统一x86_64/aarch64支持)、测试动态适配策略(使用`torch.cuda.device_count()`)以及硬件特定配置(如Blackwell的FlashAttention限制)。讨论中的设计权衡,如Dockerfile合并过程和依赖版本管理,也值得借鉴。
参与讨论