Prhub
← 返回仓库详情

标签聚合

verl-project/verl · 标签视图

标签列表

聚合结果

docker 相关 PR

2026-04-16

#6031 [ci] chore: qwen3.5 add docker file add x86 CANN8.5.2

作者 ruanhao566 · 合并时间 2026-04-16 22:49

基础设施 重要性 4.42 洞察度 3.00

为 Qwen3.5 模型新增 x86_64 架构的 Ascend NPU Docker 镜像支持。

ci npu docker fsdp

该 PR 变更直接,主要涉及基础设施配置,适合快速浏览以了解新增的 x86_64 架构支持。值得关注的是 reviewer 指出的代码重复和安全问题,这为后续优化提供了明确方向。

#6022 [ci] fix: update docker-build-ascend-a3-qwen3_5

作者 yyyy2000 · 合并时间 2026-04-16 20:56

基础设施 重要性 5.14 洞察度 4.00

更新Ascend A3 Qwen3.5 Docker CI工作流以支持多架构构建并修复触发问题。

ci docker npu

对于负责CI/CD或Docker基础设施的工程师值得精读,以了解多架构镜像构建的最佳实践和GitHub Actions配置细节;核心算法开发者可略过,除非涉及部署或硬件兼容性问题。

#6017 [fsdp] feat: qwen3.5 modify npu docker file based on CANN 8.5.2

作者 ruanhao566 · 合并时间 2026-04-16 20:39

基础设施 重要性 4.06 洞察度 3.00

为 Qwen3.5 模型升级 Ascend NPU Docker 镜像至 CANN 8.5.2 版本。

fsdp npu docker ci

此 PR 主要涉及基础设施更新,变更相对直接,适合快速浏览以了解 CANN 版本升级的配置细节。建议关注 Dockerfile 中 CANN 安装和路径设置的实现方式,以及 review 中讨论的架构兼容性修复,这些对构建可靠的多架构镜像有参考价值。

#6021 [ci] chore: add sglang new version docker for NPU

作者 xiazhahe · 合并时间 2026-04-16 14:15

基础设施 重要性 5.32 洞察度 4.00

新增Ascend NPU的SGLang v0.5.10 Dockerfile及配套CI和文档更新。

ci npu docker sglang

对于基础设施维护者和NPU用户,此PR值得浏览以了解最新NPU环境配置。建议关注Dockerfile中的安全优化建议,未来可考虑采纳以提高镜像安全性和效率。

2026-04-14

#5991 [fsdp] feat: qwen3.5 add npu docker file

作者 ruanhao566 · 合并时间 2026-04-14 14:30

功能 重要性 5.00 洞察度 3.00

为 Qwen3.5 模型新增 Ascend NPU 的 FSDP 训练 Docker 镜像和 CI 工作流。

fsdp npu docker ci

建议在合并后立即检查 Dockerfile 中的版本号,参考 review 评论进行修正以避免构建失败;对于关注 NPU 硬件支持和 Docker 部署的团队,此 PR 值得精读以了解扩展方向,但设计决策相对直白。

2026-04-10
功能 重要性 6.00 洞察度 6.00

为GB200(aarch64/Blackwell)添加Docker镜像和训练示例,扩展硬件支持并适配测试。

docker trainer examples rollout vllm

建议技术管理者和工程师精读此PR,重点关注Dockerfile多架构设计决策(如统一x86_64/aarch64支持)、测试动态适配策略(使用`torch.cuda.device_count()`)以及硬件特定配置(如Blackwell的FlashAttention限制)。讨论中的设计权衡,如Dockerfile合并过程和依赖版本管理,也值得借鉴。

2026-04-09

#5930 [ci] chore: add nightly npu docker for v0.7.1

作者 yyyy2000 · 合并时间 2026-04-09 19:53

基础设施 重要性 4.00 洞察度 3.00

新增v0.7.1版本的NPU Docker镜像并集成到CI工作流中。

ci npu docker

对于负责NPU基础设施、CI/CD或Docker镜像管理的工程师,建议阅读此PR以了解新镜像的构建细节和潜在设计缺陷。关注review中指出的问题,可能需要后续修复以确保环境稳定性和构建可靠性。

#5841 [rollout] chore: bump up trtllm image version to 1.3.0rc10

作者 Superjomn · 合并时间 2026-04-09 09:51

其他 重要性 6.00 洞察度 5.00

升级TRT-LLM镜像至1.3.0rc10,同步更新Megatron-LM和CI配置以提升兼容性。

rollout docker ci trtllm

建议技术管理者和工程师精读此PR,重点关注Dockerfile的依赖管理策略和`trtllm_async_server.py`中的索引安全修复。设计决策如权重标签的后向兼容性处理值得学习,以应对类似API升级场景。同时,注意review中未解决的DeepEP分支问题,可能需后续跟进以确保构建稳定性。