#1834 docs: add Relax to notable projects in README
作者 Yangruipis · 合并时间 2026-04-15 13:48
在README的知名项目列表中添加Relax异步RL引擎条目。
该PR变更简单,无需精读。对于想了解slime生态应用或Relax项目的读者,可快速浏览新增条目。无复杂设计决策需要关注。
标签列表
聚合结果
作者 Yangruipis · 合并时间 2026-04-15 13:48
在README的知名项目列表中添加Relax异步RL引擎条目。
该PR变更简单,无需精读。对于想了解slime生态应用或Relax项目的读者,可快速浏览新增条目。无复杂设计决策需要关注。
作者 peterjc123 · 合并时间 2026-04-07 14:56
在权重转换工具中添加从原始HF检查点补充缺失权重的功能,提升Qwen3.5模型转换完整性。
该PR值得关注其设计思路:通过维护已转换权重名称集合和从原始检查点补充缺失项的方式,优雅地解决了部分权重转换问题。建议精读save_tensors函数中新增的权重补充逻辑,理解其如何保持转换完整性同时避免重复。
作者 cjy0x · 合并时间 2026-04-07 11:19
添加NPU补丁以支持Qwen3-VL-8B模型的GRPO和PPO训练。
该PR值得精读,特别是对于涉及硬件适配或多模态训练的工程师。重点关注: 1. `slime.patch`中的资源分配逻辑变更,如Ray API替换,这可能影响分布式训练稳定性。 2. 补丁中的手动代码替换(如cuda→npu),需理解其背后的兼容性设计决策。 3. 环境配置和版本依赖,以评估部署可行性。建议结合README.md进行实操验证。
作者 zhuzilin · 合并时间 2026-04-05 10:27
同步内部代码,优化多模态模型支持和 SGLang rollout 数据并行平衡。
建议工程师精读以下部分: - slime/backends/megatron_utils/model_provider.py 中的可调用 spec 处理,了解如何扩展模型支持以适配新架构。 - slime/rollout/sglang_rollout.py 的 dp_rank_context 实现,学习负载均衡设计模式。 关注风险点,确保在测试环境中验证新功能,并考虑补充相关单元测试。
作者 peterjc123 · 合并时间 2026-04-03 11:52
在内存监控函数中添加主机内存指标,增强系统资源可见性。
该PR值得快速浏览以了解内存监控功能的扩展。关注点包括:新增依赖的管理、字段命名的一致性,以及是否需要在其他工具(如日志或指标收集)中集成这些新指标。对于涉及资源监控的开发者,此变更提供了有用的参考。
作者 peterjc123 · 合并时间 2026-03-29 13:45
为 Qwen3.5 模型添加 FP8 转换支持,通过过滤特定权重键名。
建议快速浏览此 PR 以了解 FP8 转换脚本的更新,重点关注新增的过滤条件是否覆盖了 Qwen3.5 模型的所有相关权重。对于维护类似转换逻辑或处理模型适配的工程师,可参考此变更来设计对其他模型的扩展。
作者 zhuzilin · 合并时间 2026-03-29 01:16
新增rollout trace时间线查看器,支持离线分析SGLang生成和奖励模型span事件。
此PR值得精读,特别是对于关注调试、性能优化和SGLang集成的工程师。值得关注的设计决策包括trace span上下文管理、PD时间分解的可视化处理,以及模块化工具设计,这些展示了优雅的代码组织方式。
作者 coding-famer · 合并时间 2026-03-27 15:44
为on-policy distillation添加多模态输入支持,使VLMs能够处理图像数据。
对于使用多模态蒸馏或计划集成VLMs的用户,此PR值得精读,以了解图像数据如何集成到蒸馏流程中。对于其他用户,变更较小,可快速浏览以保持对系统功能的了解。设计决策简单,主要关注向后兼容性和最小化侵入性,值得关注如何处理条件性数据添加。