#5850 [doc] chore: update README.md
作者 wuxibin89 · 合并时间 2026-04-01 20:10
在README的News部分添加verl在NVIDIA GTC26展示的新闻条目。
该PR无需精读,除非需要了解verl的公开活动记录。对于技术管理者,可快速浏览以确认文档更新;对于工程师,无技术内容值得关注。
作者 wuxibin89 · 合并时间 2026-04-01 20:10
在README的News部分添加verl在NVIDIA GTC26展示的新闻条目。
该PR无需精读,除非需要了解verl的公开活动记录。对于技术管理者,可快速浏览以确认文档更新;对于工程师,无技术内容值得关注。
作者 HollowMan6 · 合并时间 2026-04-01 18:31
在README中添加verl在PyTorch Conference Europe 2026展示Megatron后端LoRA和router replay支持的新闻条目。
该PR是简单的文档更新,无需精读。对于技术管理者,可关注项目在大型会议上的曝光,这反映了项目在Megatron后端、LoRA和router replay等领域的进展。对于工程师,无特定设计决策值得关注。
作者 arvyanh · 合并时间 2026-04-01 10:44
将DP工作量平衡功能从RL迁移到SFT训练器,优化批次负载分布。
该PR值得精读,重点关注负载平衡算法的集成方式和设计决策,如分区排序策略以减少气泡。建议工程师关注sft_trainer_ray.py中的实现细节,并考虑在类似场景中应用此模式以优化性能。
作者 wuxibin89 · 合并时间 2026-04-01 10:42
为bshd格式添加上下文并行支持,优化Megatron引擎序列处理性能。
建议技术管理者和相关工程师精读此PR,重点关注`util.py`中的序列对齐和梯度流修复设计,这些决策对实现高性能并行处理有借鉴意义。对于使用bshd格式的项目,需测试CP配置以确保兼容性。
作者 farazkh80 · 合并时间 2026-03-31 23:52
修复math_verify奖励评分在Ray工作线程中因signal.alarm()限制而静默失败的问题。
该PR值得精读,尤其关注如何绕过signal.alarm()处理线程安全问题,以及异常处理顺序的设计决策。建议工程师学习这种直接调用底层API以避免环境限制的方法。
作者 khazic · 合并时间 2026-03-31 22:04
修复 vanilla mbridge 路径中 DDP 配置的 use_distributed_optimizer 传递错误,确保梯度同步方式正确。
该 PR 值得快速浏览以了解 Megatron 模块中配置传递的模式。对于维护 megatron 相关代码的工程师,建议关注 peft_pre_wrap_hook 函数的逻辑,因为它展示了如何处理 DDP 配置的构建和覆盖。变更虽小,但涉及核心路径,有助于避免类似配置错误。
作者 0oshowero0 · 合并时间 2026-03-31 21:16
修复NPU环境下split_resource_pool的设备名设置,避免Ray自动扩展失败。
建议关注此PR,以了解如何在Ray actor中正确处理设备检测。对于类似代码,考虑采纳gemini的建议,将设备检测逻辑中心化,并添加相应测试以确保覆盖,以提高代码质量和维护性。
作者 SanftMonster · 合并时间 2026-03-31 19:54
修复 rollout 处理器缺失 image_processor 时的属性错误,避免程序崩溃。
这是一个简单的防御性编程修复,值得快速浏览以学习如何在类似场景中应用 hasattr 检查避免属性错误,但对于复杂设计决策的学习价值有限。建议工程师在访问可能缺失的属性时参考此做法。
参与讨论