← 返回仓库列表

verl-project/verl

verl: Volcano Engine Reinforcement Learning for LLMs

监控状态：已开启最近同步：2026-04-18 18:11 同步状态：空闲下次计划：2026-04-18 19:11

PR 列表

已合并 143 · 已分析 143

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-04-16

#5969 [data, trainer] fix: batch padding for multi-trajectory

作者 ZhentaoFan · 合并时间 2026-04-16 23:26

缺陷修复重要性 8.43 洞察度 6.00

修复多轨迹训练中批次样本数不满足数据并行和PPO小批次可除性导致的错误。

该PR值得精读，特别是`padding_utils.py`中的设计决策：如何构造最小填充样本、处理多维位置ID和专家路由、以及通过`is_padding`标签隔离指标计算。这些设计对于理解分布式训练中的数据对齐和性能权衡有重要参考价值。同时，应关注review中提到的性能瓶颈和边缘情况，在实际部署中监控I/O开销和指标准确性。

查看完整分析 GitHub 原始 PR datatrainerrollout

#6032 [misc] chore: remove deprecated requirements.txt

作者 wuxibin89 · 合并时间 2026-04-16 22:53

基础设施重要性 2.43 洞察度 1.00

删除两个已废弃的依赖文件，清理项目根目录。

该 PR 变更简单，属于基础设施清理，无需精读。值得关注的点是确认项目是否已完全迁移到其他依赖管理方案，以及是否有隐藏的引用需要同步清理。

查看完整分析 GitHub 原始 PR miscdepsci

#6031 [ci] chore: qwen3.5 add docker file add x86 CANN8.5.2

作者 ruanhao566 · 合并时间 2026-04-16 22:49

基础设施重要性 4.42 洞察度 3.00

为 Qwen3.5 模型新增 x86_64 架构的 Ascend NPU Docker 镜像支持。

该 PR 变更直接，主要涉及基础设施配置，适合快速浏览以了解新增的 x86_64 架构支持。值得关注的是 reviewer 指出的代码重复和安全问题，这为后续优化提供了明确方向。

查看完整分析 GitHub 原始 PR cinpudocker

#5996 [veomni] feat: add DeepSeek-V3 to MOE_PARAM_HANDERS

作者 Luosuu · 合并时间 2026-04-16 21:30

功能重要性 4.60 洞察度 3.00

为 DeepSeek-V3 MoE 模型添加 veomni 引擎参数映射支持。

该 PR 变更简单，适合快速了解 veomni 引擎如何扩展新模型支持。但需注意 review 中提到的映射 bug，建议后续关注相关修复 PR。

查看完整分析 GitHub 原始 PR veomnimodelmisc

#6012 [fully_async] fix: add fully async grpo qwen3-235b npu script in main branch

作者 wangshuyang31 · 合并时间 2026-04-16 21:03

缺陷修复重要性 5.30 洞察度 3.00

新增 Qwen3-235B 完全异步 GRPO NPU 训练脚本并修复引擎补丁问题。

建议工程师在类似 NPU 环境部署时参考此脚本的参数配置，并关注 `override_transformer_config` 修复以确保补丁应用正确性；该 PR 值得快速浏览以了解 fully_async 训练扩展。

查看完整分析 GitHub 原始 PR fully_asyncnputrainer

#6022 [ci] fix: update docker-build-ascend-a3-qwen3_5

作者 yyyy2000 · 合并时间 2026-04-16 20:56

基础设施重要性 5.14 洞察度 4.00

更新Ascend A3 Qwen3.5 Docker CI工作流以支持多架构构建并修复触发问题。

对于负责CI/CD或Docker基础设施的工程师值得精读，以了解多架构镜像构建的最佳实践和GitHub Actions配置细节；核心算法开发者可略过，除非涉及部署或硬件兼容性问题。

查看完整分析 GitHub 原始 PR cidockernpu

#6017 [fsdp] feat: qwen3.5 modify npu docker file based on CANN 8.5.2

作者 ruanhao566 · 合并时间 2026-04-16 20:39

基础设施重要性 4.06 洞察度 3.00

为 Qwen3.5 模型升级 Ascend NPU Docker 镜像至 CANN 8.5.2 版本。

此 PR 主要涉及基础设施更新，变更相对直接，适合快速浏览以了解 CANN 版本升级的配置细节。建议关注 Dockerfile 中 CANN 安装和路径设置的实现方式，以及 review 中讨论的架构兼容性修复，这些对构建可靠的多架构镜像有参考价值。

查看完整分析 GitHub 原始 PR fsdpnpudocker

#5978 [tool, rollout, cfg] feat: per-sample tool environment routing for ToolAgentLoop

作者 pull-ups · 合并时间 2026-04-16 16:11

功能重要性 5.86 洞察度 5.00

为 ToolAgentLoop 新增基于样本的工具选择功能，支持多轮 rollout 中每个样本使用不同工具子集。

此 PR 值得精读，因为它展示了如何在现有状态机中嵌入样本级配置，而无需大规模重构。关注 `run()` 方法中的工具筛选逻辑和 `getattr` 的使用，这体现了灵活的设计决策，允许逐步迁移到更复杂的工具管理系统。同时，注意 review 中关于实现与描述不符的讨论，这提醒了保持文档同步的重要性。

查看完整分析 GitHub 原始 PR toolrolloutagent_loop

第 2 / 18 页 · 共 143 条

上一页 1 2 3 4 5 … 18 下一页

支持 Prhub ♥