#1836 [fix] eval sample logging when sample is a list
作者 mathewjhan · 合并时间 2026-04-16 11:14
修复多智能体场景下评估日志记录时对列表类型样本的处理错误。
该 PR 值得快速浏览,特别是对于处理多智能体或异步生成场景的开发者。关注点在于如何优雅地处理函数返回类型的多态性,避免硬编码假设。
作者 mathewjhan · 合并时间 2026-04-16 11:14
修复多智能体场景下评估日志记录时对列表类型样本的处理错误。
该 PR 值得快速浏览,特别是对于处理多智能体或异步生成场景的开发者。关注点在于如何优雅地处理函数返回类型的多态性,避免硬编码假设。
作者 coding-famer · 合并时间 2026-04-15 14:37
修复权重转换工具中补充缺失权重时错误使用CUDA设备的问题。
该PR代码变更简单明了,适合快速了解权重转换工具的设备处理逻辑。值得关注的是工具设计中设备选择的考量:在离线预处理任务中优先保证兼容性而非性能。
作者 Yangruipis · 合并时间 2026-04-15 13:48
在README的知名项目列表中添加Relax异步RL引擎条目。
该PR变更简单,无需精读。对于想了解slime生态应用或Relax项目的读者,可快速浏览新增条目。无复杂设计决策需要关注。
参与讨论