Prhub
← 返回仓库列表

verl-project/verl

verl: Volcano Engine Reinforcement Learning for LLMs

监控状态:已开启 最近同步:2026-04-18 22:27 同步状态:空闲 下次计划:2026-04-18 23:27

PR 列表

已合并 143 · 已分析 143
更多筛选
2026-04-03
基础设施 重要性 7.00 洞察度 6.00

修复所有CI流水线,升级transformers至5.3.0和vLLM至0.18.0以解决兼容性问题。

建议工程团队精读此PR,重点关注模型兼容性修复(如rope_theta处理和visual输出解包)和权重同步逻辑重构,这些设计决策展示了处理重大依赖升级时的系统化方法,对类似升级有借鉴意义。

#5871 [doc] chore: add npu faq doc

作者 hustmf · 合并时间 2026-04-03 10:13

文档 重要性 3.00 洞察度 2.00

添加NPU常见问题解答文档,覆盖环境配置、调试和错误处理。

建议快速浏览以了解NPU常见问题,重点关注review中指出的配置键部分,实际使用时参考'reviewer建议'或配置文件'verl/trainer/config/npu_profile/npu_profile.yaml'。文档本身无需深入代码精读。

其他 重要性 3.00 洞察度 4.00

更新完全异步DAPO训练脚本,调整超参数以对齐同步脚本的奖励进展。

建议相关实验人员仔细阅读该脚本的变更,特别是超参数调整的逻辑。对于研究异步训练调优的工程师,可以关注staleness_threshold和PPO token长度计算的调整策略。普通开发者无需深入阅读。

2026-04-02
重构 重要性 6.00 洞察度 5.00

统一PPO训练器配置,通过model_engine参数替代独立Megatron配置文件

该PR值得精读,因为它是配置系统的重大重构,涉及设计决策如model_engine参数的使用和配置分层。建议关注review中指出的风险点,检查配置迁移指南或文档更新,并验证Megatron工作流的兼容性。

misc 重要性 1.00 洞察度 1.00

为trtllm_rollout包的__init__.py文件添加Apache 2.0许可证头。

此PR无需精读,除非您特别关注许可证合规细节。变更简单明了,没有值得关注的设计决策。对于工程师,可以快速浏览以确认许可证头正确;对于管理者,可视为例行维护。

2026-04-01
功能 重要性 6.00 洞察度 6.00

添加AI代理指令框架并整合CI检查到pre-commit,支持代理辅助开发。

建议技术管理者阅读AGENTS.md了解代理贡献政策,工程师关注.pre-commit-config.yaml的更改以适配本地开发环境。此PR值得精读,因为它展示了如何构建框架无关的代理指令系统和整合CI检查的设计决策。

参与讨论