Prhub
← 返回仓库详情

标签聚合

verl-project/verl · 标签视图

标签列表

聚合结果

ckpt 相关 PR

2026-04-08
缺陷修复 重要性 4.00 洞察度 3.00

修复检查点引擎管理器在driver进程未加载自定义后端模块的bug。

ckpt trainer misc

该PR值得快速浏览,了解检查点插件系统的driver-worker一致性设计。关注点:1. import_external_libs函数的设计(未在PR中展示,但推测是统一的外部库导入机制)。2. 与#5718的关联,理解完整的插件钩子实现。

功能 重要性 6.00 洞察度 6.00

新增检查点引擎插件钩子,支持自定义权重同步后端管理器和后端模块导入。

ckpt trainer config misc

该PR值得精读,特别是关注插件钩子设计模式和安全考虑。建议工程师学习如何复用现有`agent_loop_manager_class`钩子模式,并审视`import_external_libs`的使用以评估安全风险。

2026-03-26

#5575 [megatron] feat: checkpoint save as HF PEFT format

作者 HollowMan6 · 合并时间 2026-03-26 16:21

功能 重要性 6.00 洞察度 6.00

为 Megatron 模块添加检查点保存为 Hugging Face PEFT 格式的功能。

megatron ckpt lora

建议阅读 megatron_checkpoint_manager.py 和 megatron_utils.py 中的修改,关注如何处理 PEFT 状态字典、私有 API 使用以及向后兼容性设计。设计决策值得学习,尤其是向标准 API 迁移的策略和风险管理。

2026-03-23
缺陷修复 重要性 5.00 洞察度 3.00

将 `dist_ckpt_optim_fully_reshardable` 默认值设为 False,以避免检查点保存时的高 CPU 内存 OOM。

ckpt trainer config

建议:此 PR 值得精读,特别是对于使用大模型训练的团队。重点阅读 `verl/trainer/config/engine/megatron.yaml` 的更改和文档中的警告部分,了解 fully reshardable 与 dp-reshardable 格式的权衡,以确保正确配置检查点策略。