#5653 [fully_async] chore: Add fully async dapo qwen3-30b npu script
作者 wangshuyang31 · 合并时间 2026-03-24 21:41
新增 fully async DAPO 训练脚本,支持 Qwen3-30B 模型在 NPU 硬件上运行。
建议关注 review 中指出的 `overlong_buffer_len` 问题,在使用脚本前验证配置正确性。PR 本身变更简单,无需深入代码阅读,但可作为示例学习配置参数设置,并注意配置陷阱。
参与讨论