#6031 [ci] chore: qwen3.5 add docker file add x86 CANN8.5.2
作者 ruanhao566 · 合并时间 2026-04-16 22:49
为 Qwen3.5 模型新增 x86_64 架构的 Ascend NPU Docker 镜像支持。
该 PR 变更直接,主要涉及基础设施配置,适合快速浏览以了解新增的 x86_64 架构支持。值得关注的是 reviewer 指出的代码重复和安全问题,这为后续优化提供了明确方向。
标签列表
聚合结果
作者 ruanhao566 · 合并时间 2026-04-16 22:49
为 Qwen3.5 模型新增 x86_64 架构的 Ascend NPU Docker 镜像支持。
该 PR 变更直接,主要涉及基础设施配置,适合快速浏览以了解新增的 x86_64 架构支持。值得关注的是 reviewer 指出的代码重复和安全问题,这为后续优化提供了明确方向。
作者 wangshuyang31 · 合并时间 2026-04-16 21:03
新增 Qwen3-235B 完全异步 GRPO NPU 训练脚本并修复引擎补丁问题。
建议工程师在类似 NPU 环境部署时参考此脚本的参数配置,并关注 `override_transformer_config` 修复以确保补丁应用正确性;该 PR 值得快速浏览以了解 fully_async 训练扩展。
作者 yyyy2000 · 合并时间 2026-04-16 20:56
更新Ascend A3 Qwen3.5 Docker CI工作流以支持多架构构建并修复触发问题。
对于负责CI/CD或Docker基础设施的工程师值得精读,以了解多架构镜像构建的最佳实践和GitHub Actions配置细节;核心算法开发者可略过,除非涉及部署或硬件兼容性问题。
作者 ruanhao566 · 合并时间 2026-04-16 20:39
为 Qwen3.5 模型升级 Ascend NPU Docker 镜像至 CANN 8.5.2 版本。
此 PR 主要涉及基础设施更新,变更相对直接,适合快速浏览以了解 CANN 版本升级的配置细节。建议关注 Dockerfile 中 CANN 安装和路径设置的实现方式,以及 review 中讨论的架构兼容性修复,这些对构建可靠的多架构镜像有参考价值。
作者 xiazhahe · 合并时间 2026-04-16 14:15
新增Ascend NPU的SGLang v0.5.10 Dockerfile及配套CI和文档更新。
对于基础设施维护者和NPU用户,此PR值得浏览以了解最新NPU环境配置。建议关注Dockerfile中的安全优化建议,未来可考虑采纳以提高镜像安全性和效率。
作者 Silas-11 · 合并时间 2026-04-15 10:26
新增Qwen3-VL-8B模型在geo3k数据集上的完全异步GRPO训练脚本。
该PR值得快速浏览,了解异步训练配置和参数组织方式。建议关注异步特定参数如`staleness_threshold`和`rollout_correction`的设计,以及配置块的组织模式,以复用最佳实践。
作者 tardis-key · 合并时间 2026-04-14 16:53
将 PrecisionDebugger 文档移动到 ascend_tutorial 目录并简化配置示例。
该 PR 变更简单,主要涉及文档整理,无需深入精读。建议关注配置简化的合理性,并确认 summary_mode 变更是否与近期 PR(如 #5986)的 PrecisionDebugger 改进一致。
作者 Tjh-UKN · 合并时间 2026-04-14 15:52
简化 PrecisionDebugger 配置,统一使用全局 profiler 控制步骤和保存路径。
该 PR 值得精读,重点关注配置简化设计如何统一 profiler 控制。推荐关注 PrecisionDebuggerToolConfig 类的变更和 PrecisionDebuggerProfiler 中路径与步骤逻辑的调整,这些是核心设计决策。对于使用 msprobe 的工程师,应仔细阅读更新后的文档以适应新配置方式。