#1823 Add fallback for get_seqlen_balanced_partitions
作者 zhuzilin · 合并时间 2026-04-09 20:29
为序列长度平衡分区添加后备机制,防止分区超出GPU内存限制。
该PR值得精读,特别是关注_get_capped_partitions算法的设计决策(first-fit与令牌上限)以及VPP microbatches计算调整的逻辑。建议工程师在涉及VPP或长序列训练时验证后备机制的有效性,并考虑补充单元测试以覆盖边界情况。