← 返回仓库详情

标签聚合

verl-project/verl · 标签视图

标签列表

misc · 79

trainer · 64

rollout · 35

megatron · 32

npu · 31

ci · 27

model · 24

perf · 17

vllm · 16

doc · 14

examples · 14

fsdp · 12

config · 11

worker · 10

docker · 9

distillation · 7

experimental · 7

fully_async · 7

lora · 6

algo · 5

deps · 5

quantization · 5

sglang · 5

tool · 5

ckpt · 4

diffusion · 4

reward · 4

agent_loop · 3

trtllm · 3

veomni · 3

data · 2

teacher · 2

one_step_off · 1

transferqueue · 1

聚合结果

fsdp 相关 PR

2026-04-16

#6031 [ci] chore: qwen3.5 add docker file add x86 CANN8.5.2

作者 ruanhao566 · 合并时间 2026-04-16 22:49

基础设施重要性 4.42 洞察度 3.00

为 Qwen3.5 模型新增 x86_64 架构的 Ascend NPU Docker 镜像支持。

ci npu docker fsdp

该 PR 变更直接，主要涉及基础设施配置，适合快速浏览以了解新增的 x86_64 架构支持。值得关注的是 reviewer 指出的代码重复和安全问题，这为后续优化提供了明确方向。

查看完整分析 GitHub 原始 PR

#6017 [fsdp] feat: qwen3.5 modify npu docker file based on CANN 8.5.2

作者 ruanhao566 · 合并时间 2026-04-16 20:39

基础设施重要性 4.06 洞察度 3.00

为 Qwen3.5 模型升级 Ascend NPU Docker 镜像至 CANN 8.5.2 版本。

fsdp npu docker ci

此 PR 主要涉及基础设施更新，变更相对直接，适合快速浏览以了解 CANN 版本升级的配置细节。建议关注 Dockerfile 中 CANN 安装和路径设置的实现方式，以及 review 中讨论的架构兼容性修复，这些对构建可靠的多架构镜像有参考价值。

查看完整分析 GitHub 原始 PR

2026-04-14

#5991 [fsdp] feat: qwen3.5 add npu docker file

作者 ruanhao566 · 合并时间 2026-04-14 14:30

功能重要性 5.00 洞察度 3.00

为 Qwen3.5 模型新增 Ascend NPU 的 FSDP 训练 Docker 镜像和 CI 工作流。

fsdp npu docker ci

建议在合并后立即检查 Dockerfile 中的版本号，参考 review 评论进行修正以避免构建失败；对于关注 NPU 硬件支持和 Docker 部署的团队，此 PR 值得精读以了解扩展方向，但设计决策相对直白。

查看完整分析 GitHub 原始 PR

2026-04-07

#5885 [cfg] fix: sync strategy from ActorConfig/CriticConfig to EngineConfig

作者 yifannnwu · 合并时间 2026-04-07 10:46

缺陷修复重要性 5.00 洞察度 4.00

修复FSDP Actor/Critic配置中strategy未同步到EngineConfig，导致FSDP2训练回退到FSDP1的问题。

trainer config fsdp misc

该PR值得精读，因为它揭示了配置层与引擎层之间的字段同步问题，特别是使用object.__setattr__绕过BaseConfig冻结逻辑的设计决策。关注点：为何只同步strategy而未采纳ulysses_sequence_parallel_size建议，以及FSDP1/FSDP2后端选择机制。

查看完整分析 GitHub 原始 PR

2026-04-03

#5802 [4/n][trainer] feat: flowgrpo - add diffusers + fsdp engine support

作者 zhtmike · 合并时间 2026-04-03 22:15

功能重要性 7.00 洞察度 7.00

新增基于Diffusers和FSDP的扩散模型训练引擎，支持FlowGRPO算法。

trainer fsdp diffusion algo model

建议技术管理者和工程师精读此PR，重点关注：1. DiffusersFSDPEngine的设计模式，特别是与现有FSDP引擎的异同。2. DiffusionModelBase注册机制如何实现模型扩展性。3. review讨论中的权衡决策，如模型兼容性限制和损失归一化处理。这对于理解扩散模型RL训练架构有重要参考价值。

查看完整分析 GitHub 原始 PR

#5861 [doc] feat: add NVFP4 QAT documentation

作者 zhangyimi · 合并时间 2026-04-03 14:10

文档重要性 3.00 洞察度 2.00

新增NVFP4量化感知训练文档，涵盖FSDP和Megatron后端的配置说明。

doc quantization megatron fsdp misc

该PR值得快速浏览以了解NVFP4 QAT的配置概览，但文档中的两个未解决问题需要后续跟进。建议关注quantization_config_path参数的实际使用情况和模型名称的准确性，以确保文档与代码实现一致。

查看完整分析 GitHub 原始 PR

2026-04-01

#5679 [megatron, fsdp] feat: DP workload balance for SFT

作者 arvyanh · 合并时间 2026-04-01 10:44

功能重要性 6.00 洞察度 6.00

将DP工作量平衡功能从RL迁移到SFT训练器，优化批次负载分布。

megatron fsdp trainer perf

该PR值得精读，重点关注负载平衡算法的集成方式和设计决策，如分区排序策略以减少气泡。建议工程师关注sft_trainer_ray.py中的实现细节，并考虑在类似场景中应用此模式以优化性能。

查看完整分析 GitHub 原始 PR

2026-03-30

#5682 [fsdp, model] feat: add qwen3.5 fsdp grpo training support.

作者 Zhang1Sheng · 合并时间 2026-03-30 13:48

功能重要性 6.00 洞察度 6.00

新增Qwen3.5模型的FSDP GRPO训练支持，涵盖适配器、补丁和示例脚本。

fsdp model trainer examples npu

该PR值得精读，特别是qwen3_5.py中的适配器设计展示了如何修复FSDP2 CPU卸载bug，以及monkey_patch.py的扩展模式。建议关注配置参数设置、依赖版本管理和测试覆盖策略，以避免常见部署问题。

查看完整分析 GitHub 原始 PR

第 1 / 2 页 · 共 12 条

1 2 下一页