← 返回仓库详情

标签聚合

verl-project/verl · 标签视图

标签列表

misc · 79

trainer · 64

rollout · 35

megatron · 32

npu · 31

ci · 27

model · 24

perf · 17

vllm · 16

doc · 14

examples · 14

fsdp · 12

config · 11

worker · 10

docker · 9

distillation · 7

experimental · 7

fully_async · 7

lora · 6

algo · 5

deps · 5

quantization · 5

sglang · 5

tool · 5

ckpt · 4

diffusion · 4

reward · 4

agent_loop · 3

trtllm · 3

veomni · 3

data · 2

teacher · 2

one_step_off · 1

transferqueue · 1

聚合结果

lora 相关 PR

2026-04-09

#5909 [trainer,perf] fix: enable profiler for SFT trainer

作者 wuxibin89 · 合并时间 2026-04-09 09:54

缺陷修复重要性 6.00 洞察度 5.00

为SFT训练器启用性能分析器并修复Megatron后端LoRA训练问题。

trainer perf megatron lora

建议技术管理者关注数据集处理和分布式设置的风险点，工程师应精读`transformer_impl.py`中的LoRA权重同步逻辑和`engine_workers.py`的性能分析注解实现，以理解设计决策和潜在问题。

查看完整分析 GitHub 原始 PR

2026-04-02

#5848 [cfg] refactor: unify ppo_trainer and ppo_megatron_trainer config

作者 wuxibin89 · 合并时间 2026-04-02 22:58

重构重要性 6.00 洞察度 5.00

统一PPO训练器配置，通过model_engine参数替代独立Megatron配置文件

trainer config megatron lora

该PR值得精读，因为它是配置系统的重大重构，涉及设计决策如model_engine参数的使用和配置分层。建议关注review中指出的风险点，检查配置迁移指南或文档更新，并验证Megatron工作流的兼容性。

查看完整分析 GitHub 原始 PR

2026-04-01

#5847 [doc] chore: add news for PyTorch Conference Europe 2026

作者 HollowMan6 · 合并时间 2026-04-01 18:31

文档重要性 1.00 洞察度 1.00

在README中添加verl在PyTorch Conference Europe 2026展示Megatron后端LoRA和router replay支持的新闻条目。

doc megatron lora

该PR是简单的文档更新，无需精读。对于技术管理者，可关注项目在大型会议上的曝光，这反映了项目在Megatron后端、LoRA和router replay等领域的进展。对于工程师，无特定设计决策值得关注。

查看完整分析 GitHub 原始 PR

2026-03-31

#5769 [sglang, rollout] fix: wire up LoRA adapter path for engine_workers + sglang sleep

作者 cavities12 · 合并时间 2026-03-31 14:57

缺陷修复重要性 6.00 洞察度 6.00

修复SGLang rollout中LoRA适配器路径的权重同步顺序和内存释放问题。

sglang rollout lora

建议精读engine_workers.py中的update_weights方法，关注base_sync_done逻辑调整和两阶段同步设计，这体现了SGLang与vLLM后端在LoRA处理上的重要差异。同时，review讨论中的跨后端兼容性权衡值得关注。

查看完整分析 GitHub 原始 PR

2026-03-26

#5575 [megatron] feat: checkpoint save as HF PEFT format

作者 HollowMan6 · 合并时间 2026-03-26 16:21

功能重要性 6.00 洞察度 6.00

为 Megatron 模块添加检查点保存为 Hugging Face PEFT 格式的功能。

megatron ckpt lora

建议阅读 megatron_checkpoint_manager.py 和 megatron_utils.py 中的修改，关注如何处理 PEFT 状态字典、私有 API 使用以及向后兼容性设计。设计决策值得学习，尤其是向标准 API 迁移的策略和风险管理。

查看完整分析 GitHub 原始 PR

2026-03-25

#5742 [ckpt] fix: handle string task_type in LoRA model merger

作者 FrankHo-Hwc · 合并时间 2026-03-25 19:32

缺陷修复重要性 4.00 洞察度 4.00

修复 LoRA 模型合并器中字符串 task_type 导致的 AttributeError。

lora

该 PR 值得精读，因为它展示了在兼容性修复中如何处理类型检查和错误处理，尤其关注 review 反馈对 falsy 值行为的讨论，这对于类似场景的设计决策有参考价值。

查看完整分析 GitHub 原始 PR