Prhub
← 返回仓库详情

标签聚合

verl-project/verl · 标签视图

标签列表

聚合结果

data 相关 PR

2026-04-16

#5969 [data, trainer] fix: batch padding for multi-trajectory

作者 ZhentaoFan · 合并时间 2026-04-16 23:26

缺陷修复 重要性 8.43 洞察度 6.00

修复多轨迹训练中批次样本数不满足数据并行和PPO小批次可除性导致的错误。

data trainer rollout misc

该PR值得精读,特别是`padding_utils.py`中的设计决策:如何构造最小填充样本、处理多维位置ID和专家路由、以及通过`is_padding`标签隔离指标计算。这些设计对于理解分布式训练中的数据对齐和性能权衡有重要参考价值。同时,应关注review中提到的性能瓶颈和边缘情况,在实际部署中监控I/O开销和指标准确性。

#6001 [data] fix: pad data in preprocess_packed_seqs if shorter than align_size

作者 beirong8kmiles · 合并时间 2026-04-16 16:04

缺陷修复 重要性 5.91 洞察度 4.00

修复序列预处理中数据长度不足导致的索引越界问题,确保上下文并行切片安全。

data megatron misc

该 PR 值得精读,因为它展示了在分布式训练中处理数据对齐和边界条件的典型模式。关注点包括: - 如何安全地处理可变长度序列的切片,避免索引越界。 - 在 review 讨论中,权衡了填充方案与索引检查方案的优缺点,最终选择了更轻量级的修复方式。 - 可作为处理类似数据预处理边界问题的参考案例。