Prhub
← 返回仓库详情

标签聚合

verl-project/verl · 标签视图

标签列表

聚合结果

fsdp 相关 PR

2026-04-16

#6031 [ci] chore: qwen3.5 add docker file add x86 CANN8.5.2

作者 ruanhao566 · 合并时间 2026-04-16 22:49

基础设施 重要性 4.42 洞察度 3.00

为 Qwen3.5 模型新增 x86_64 架构的 Ascend NPU Docker 镜像支持。

ci npu docker fsdp

该 PR 变更直接,主要涉及基础设施配置,适合快速浏览以了解新增的 x86_64 架构支持。值得关注的是 reviewer 指出的代码重复和安全问题,这为后续优化提供了明确方向。

#6017 [fsdp] feat: qwen3.5 modify npu docker file based on CANN 8.5.2

作者 ruanhao566 · 合并时间 2026-04-16 20:39

基础设施 重要性 4.06 洞察度 3.00

为 Qwen3.5 模型升级 Ascend NPU Docker 镜像至 CANN 8.5.2 版本。

fsdp npu docker ci

此 PR 主要涉及基础设施更新,变更相对直接,适合快速浏览以了解 CANN 版本升级的配置细节。建议关注 Dockerfile 中 CANN 安装和路径设置的实现方式,以及 review 中讨论的架构兼容性修复,这些对构建可靠的多架构镜像有参考价值。

2026-04-14

#5991 [fsdp] feat: qwen3.5 add npu docker file

作者 ruanhao566 · 合并时间 2026-04-14 14:30

功能 重要性 5.00 洞察度 3.00

为 Qwen3.5 模型新增 Ascend NPU 的 FSDP 训练 Docker 镜像和 CI 工作流。

fsdp npu docker ci

建议在合并后立即检查 Dockerfile 中的版本号,参考 review 评论进行修正以避免构建失败;对于关注 NPU 硬件支持和 Docker 部署的团队,此 PR 值得精读以了解扩展方向,但设计决策相对直白。

2026-04-07

#5885 [cfg] fix: sync strategy from ActorConfig/CriticConfig to EngineConfig

作者 yifannnwu · 合并时间 2026-04-07 10:46

缺陷修复 重要性 5.00 洞察度 4.00

修复FSDP Actor/Critic配置中strategy未同步到EngineConfig,导致FSDP2训练回退到FSDP1的问题。

trainer config fsdp misc

该PR值得精读,因为它揭示了配置层与引擎层之间的字段同步问题,特别是使用object.__setattr__绕过BaseConfig冻结逻辑的设计决策。关注点:为何只同步strategy而未采纳ulysses_sequence_parallel_size建议,以及FSDP1/FSDP2后端选择机制。

2026-04-03

#5802 [4/n][trainer] feat: flowgrpo - add diffusers + fsdp engine support

作者 zhtmike · 合并时间 2026-04-03 22:15

功能 重要性 7.00 洞察度 7.00

新增基于Diffusers和FSDP的扩散模型训练引擎,支持FlowGRPO算法。

trainer fsdp diffusion algo model

建议技术管理者和工程师精读此PR,重点关注:1. DiffusersFSDPEngine的设计模式,特别是与现有FSDP引擎的异同。2. DiffusionModelBase注册机制如何实现模型扩展性。3. review讨论中的权衡决策,如模型兼容性限制和损失归一化处理。这对于理解扩散模型RL训练架构有重要参考价值。

#5861 [doc] feat: add NVFP4 QAT documentation

作者 zhangyimi · 合并时间 2026-04-03 14:10

文档 重要性 3.00 洞察度 2.00

新增NVFP4量化感知训练文档,涵盖FSDP和Megatron后端的配置说明。

doc quantization megatron fsdp misc

该PR值得快速浏览以了解NVFP4 QAT的配置概览,但文档中的两个未解决问题需要后续跟进。建议关注quantization_config_path参数的实际使用情况和模型名称的准确性,以确保文档与代码实现一致。

2026-04-01

#5679 [megatron, fsdp] feat: DP workload balance for SFT

作者 arvyanh · 合并时间 2026-04-01 10:44

功能 重要性 6.00 洞察度 6.00

将DP工作量平衡功能从RL迁移到SFT训练器,优化批次负载分布。

megatron fsdp trainer perf

该PR值得精读,重点关注负载平衡算法的集成方式和设计决策,如分区排序策略以减少气泡。建议工程师关注sft_trainer_ray.py中的实现细节,并考虑在类似场景中应用此模式以优化性能。

2026-03-30

#5682 [fsdp, model] feat: add qwen3.5 fsdp grpo training support.

作者 Zhang1Sheng · 合并时间 2026-03-30 13:48

功能 重要性 6.00 洞察度 6.00

新增Qwen3.5模型的FSDP GRPO训练支持,涵盖适配器、补丁和示例脚本。

fsdp model trainer examples npu

该PR值得精读,特别是qwen3_5.py中的适配器设计展示了如何修复FSDP2 CPU卸载bug,以及monkey_patch.py的扩展模式。建议关注配置参数设置、依赖版本管理和测试覆盖策略,以避免常见部署问题。