Prhub
← 返回仓库详情

标签聚合

THUDM/slime · 标签视图

标签列表

聚合结果

configuration 相关 PR

2026-04-16

#1836 [fix] eval sample logging when sample is a list

作者 mathewjhan · 合并时间 2026-04-16 11:14

缺陷修复 重要性 4.97 洞察度 3.00

修复多智能体场景下评估日志记录时对列表类型样本的处理错误。

bugfix configuration multimodal

该 PR 值得快速浏览,特别是对于处理多智能体或异步生成场景的开发者。关注点在于如何优雅地处理函数返回类型的多态性,避免硬编码假设。

2026-04-15
缺陷修复 重要性 4.35 洞察度 3.00

修复权重转换工具中补充缺失权重时错误使用CUDA设备的问题。

bugfix configuration tools

该PR代码变更简单明了,适合快速了解权重转换工具的设备处理逻辑。值得关注的是工具设计中设备选择的考量:在离线预处理任务中优先保证兼容性而非性能。

#1834 docs: add Relax to notable projects in README

作者 Yangruipis · 合并时间 2026-04-15 13:48

文档 重要性 1.89 洞察度 1.00

在README的知名项目列表中添加Relax异步RL引擎条目。

docs configuration feature

该PR变更简单,无需精读。对于想了解slime生态应用或Relax项目的读者,可快速浏览新增条目。无复杂设计决策需要关注。

2026-04-09

#1823 Add fallback for get_seqlen_balanced_partitions

作者 zhuzilin · 合并时间 2026-04-09 20:29

缺陷修复 重要性 5.00 洞察度 4.00

为序列长度平衡分区添加后备机制,防止分区超出GPU内存限制。

bugfix configuration performance

该PR值得精读,特别是关注_get_capped_partitions算法的设计决策(first-fit与令牌上限)以及VPP microbatches计算调整的逻辑。建议工程师在涉及VPP或长序列训练时验证后备机制的有效性,并考虑补充单元测试以覆盖边界情况。

#1822 Revert no_grad for entropy to prevent comm stuck in dsa

作者 zhuzilin · 合并时间 2026-04-09 19:20

缺陷修复 重要性 5.00 洞察度 4.00

移除熵计算中的no_grad上下文,修复DSA模式下通信卡死问题。

bugfix configuration performance

建议技术管理者和核心工程师精读此PR,重点关注: 1. 熵计算梯度保留的设计决策,理解DSA通信机制的特殊要求。 2. 分布式张量重建逻辑中对None值的处理方式,确保边缘场景覆盖。 3. 结合近期PR #1788(修复loss oom)和 #1762(修复grad_norm初始化)一起分析,这些PR都涉及损失计算和梯度处理的底层优化。

2026-04-07

#1813 [conda] Add install custom sgl-router to build_conda.sh

作者 zhuzilin · 合并时间 2026-04-07 15:06

基础设施 重要性 3.00 洞察度 2.00

在conda构建脚本中添加自定义sgl-router安装命令以支持R3功能。

configuration dependency docker

该PR变更简单直接,无需深入代码审查。建议: 1. **基础设施维护者**:关注该行命令的长期维护,未来sgl-router更新时需同步更新版本。 2. **新用户**:如果遇到conda环境构建问题,可检查该依赖安装是否成功。 3. **架构学习者**:可结合PR #1773(移除slime_router)和PR #1770(切换Docker依赖)理解完整的router架构迁移脉络。

#1762 [Fix] Initialize grad_norm before found_inf skip path

作者 kaysonyu · 合并时间 2026-04-07 14:59

缺陷修复 重要性 4.00 洞察度 3.00

修复Megatron训练中found_inf=True时grad_norm未初始化导致的UnboundLocalError。

bugfix configuration performance

该PR变更简单直接,适合快速浏览以了解Megatron训练中异常处理机制。值得关注的是,它揭示了梯度检查与训练步骤之间的耦合关系,以及如何通过变量初始化避免边界条件错误。对于维护类似训练循环的工程师有参考价值。

#1812 feat: add support for including missing weights from origin HF checkp…

作者 peterjc123 · 合并时间 2026-04-07 14:56

功能 重要性 5.00 洞察度 4.00

在权重转换工具中添加从原始HF检查点补充缺失权重的功能,提升Qwen3.5模型转换完整性。

feature configuration multimodal

该PR值得关注其设计思路:通过维护已转换权重名称集合和从原始检查点补充缺失项的方式,优雅地解决了部分权重转换问题。建议精读save_tensors函数中新增的权重补充逻辑,理解其如何保持转换完整性同时避免重复。