Prhub
← 返回仓库详情

标签聚合

verl-project/verl · 标签视图

标签列表

聚合结果

npu 相关 PR

2026-04-16

#6031 [ci] chore: qwen3.5 add docker file add x86 CANN8.5.2

作者 ruanhao566 · 合并时间 2026-04-16 22:49

基础设施 重要性 4.42 洞察度 3.00

为 Qwen3.5 模型新增 x86_64 架构的 Ascend NPU Docker 镜像支持。

ci npu docker fsdp

该 PR 变更直接,主要涉及基础设施配置,适合快速浏览以了解新增的 x86_64 架构支持。值得关注的是 reviewer 指出的代码重复和安全问题,这为后续优化提供了明确方向。

#6012 [fully_async] fix: add fully async grpo qwen3-235b npu script in main branch

作者 wangshuyang31 · 合并时间 2026-04-16 21:03

缺陷修复 重要性 5.30 洞察度 3.00

新增 Qwen3-235B 完全异步 GRPO NPU 训练脚本并修复引擎补丁问题。

fully_async npu trainer megatron examples

建议工程师在类似 NPU 环境部署时参考此脚本的参数配置,并关注 `override_transformer_config` 修复以确保补丁应用正确性;该 PR 值得快速浏览以了解 fully_async 训练扩展。

#6022 [ci] fix: update docker-build-ascend-a3-qwen3_5

作者 yyyy2000 · 合并时间 2026-04-16 20:56

基础设施 重要性 5.14 洞察度 4.00

更新Ascend A3 Qwen3.5 Docker CI工作流以支持多架构构建并修复触发问题。

ci docker npu

对于负责CI/CD或Docker基础设施的工程师值得精读,以了解多架构镜像构建的最佳实践和GitHub Actions配置细节;核心算法开发者可略过,除非涉及部署或硬件兼容性问题。

#6017 [fsdp] feat: qwen3.5 modify npu docker file based on CANN 8.5.2

作者 ruanhao566 · 合并时间 2026-04-16 20:39

基础设施 重要性 4.06 洞察度 3.00

为 Qwen3.5 模型升级 Ascend NPU Docker 镜像至 CANN 8.5.2 版本。

fsdp npu docker ci

此 PR 主要涉及基础设施更新,变更相对直接,适合快速浏览以了解 CANN 版本升级的配置细节。建议关注 Dockerfile 中 CANN 安装和路径设置的实现方式,以及 review 中讨论的架构兼容性修复,这些对构建可靠的多架构镜像有参考价值。

#6021 [ci] chore: add sglang new version docker for NPU

作者 xiazhahe · 合并时间 2026-04-16 14:15

基础设施 重要性 5.32 洞察度 4.00

新增Ascend NPU的SGLang v0.5.10 Dockerfile及配套CI和文档更新。

ci npu docker sglang

对于基础设施维护者和NPU用户,此PR值得浏览以了解最新NPU环境配置。建议关注Dockerfile中的安全优化建议,未来可考虑采纳以提高镜像安全性和效率。

2026-04-15
功能 重要性 5.32 洞察度 4.00

新增Qwen3-VL-8B模型在geo3k数据集上的完全异步GRPO训练脚本。

fully_async examples npu trainer

该PR值得快速浏览,了解异步训练配置和参数组织方式。建议关注异步特定参数如`staleness_threshold`和`rollout_correction`的设计,以及配置块的组织模式,以复用最佳实践。

2026-04-14

#6004 [doc] feat: move msprobe to ascend_tutorial

作者 tardis-key · 合并时间 2026-04-14 16:53

文档 重要性 2.00 洞察度 2.00

将 PrecisionDebugger 文档移动到 ascend_tutorial 目录并简化配置示例。

doc npu perf

该 PR 变更简单,主要涉及文档整理,无需深入精读。建议关注配置简化的合理性,并确认 summary_mode 变更是否与近期 PR(如 #5986)的 PrecisionDebugger 改进一致。

#5986 [perf] feat: simplify precision_debugger config behavior and docs

作者 Tjh-UKN · 合并时间 2026-04-14 15:52

性能优化 重要性 6.00 洞察度 5.00

简化 PrecisionDebugger 配置,统一使用全局 profiler 控制步骤和保存路径。

perf doc trainer npu

该 PR 值得精读,重点关注配置简化设计如何统一 profiler 控制。推荐关注 PrecisionDebuggerToolConfig 类的变更和 PrecisionDebuggerProfiler 中路径与步骤逻辑的调整,这些是核心设计决策。对于使用 msprobe 的工程师,应仔细阅读更新后的文档以适应新配置方式。