#6012 [fully_async] fix: add fully async grpo qwen3-235b npu script in main branch
作者 wangshuyang31 · 合并时间 2026-04-16 21:03
新增 Qwen3-235B 完全异步 GRPO NPU 训练脚本并修复引擎补丁问题。
建议工程师在类似 NPU 环境部署时参考此脚本的参数配置,并关注 `override_transformer_config` 修复以确保补丁应用正确性;该 PR 值得快速浏览以了解 fully_async 训练扩展。