Prhub
← 返回仓库列表

THUDM/slime

slime is an LLM post-training framework for RL Scaling.

监控状态:已开启 最近同步:2026-04-18 18:18 同步状态:空闲 下次计划:2026-04-18 19:18

PR 列表

已合并 52 · 已分析 52
更多筛选
2026-03-27

#1773 refactor: remove slime router

作者 zhuzilin · 合并时间 2026-03-27 16:57

重构 重要性 6.00 洞察度 5.00

移除过时的slime router,统一使用sglang_router以简化架构。

建议阅读slime/ray/rollout.py中的_start_router函数变更,以理解router启动逻辑的统一化设计;同时关注slime/utils/arguments.py的弃用处理,学习向后兼容的最佳实践。此PR值得精读,因为它揭示了架构演进方向。

#1760 [Multimodal] Add Multimodal OPD support

作者 coding-famer · 合并时间 2026-03-27 15:44

功能 重要性 5.00 洞察度 3.00

为on-policy distillation添加多模态输入支持,使VLMs能够处理图像数据。

对于使用多模态蒸馏或计划集成VLMs的用户,此PR值得精读,以了解图像数据如何集成到蒸馏流程中。对于其他用户,变更较小,可快速浏览以保持对系统功能的了解。设计决策简单,主要关注向后兼容性和最小化侵入性,值得关注如何处理条件性数据添加。

#1772 [docker] update sgl-router

作者 zhuzilin · 合并时间 2026-03-27 14:47

基础设施 重要性 3.00 洞察度 2.00

更新Dockerfile中的sgl-router依赖至新构建版本。

此PR变更简单,主要为依赖更新,无需深入精读。建议关注后续PR中sgl-router相关变更(如PR#1770),以了解依赖演进和潜在影响。

2026-03-26

#1770 use zhuzilin/sgl-router for sglang-router

作者 zhuzilin · 合并时间 2026-03-26 17:07

基础设施 重要性 3.00 洞察度 2.00

将 sglang-router 依赖切换为自定义版本,并更新文档以简化配置要求。

该 PR 值得精读,特别是文档变更部分,以了解 R3 功能的新配置要求;依赖变更部分需要关注自定义源是否稳定,建议在部署前测试新版本兼容性。

#1768 Fix uploading sglang metrics to wandb

作者 zhuzilin · 合并时间 2026-03-26 13:23

缺陷修复 重要性 5.00 洞察度 5.00

修复 wandb 初始化时机问题,确保 SGLang 指标正确上传。

对于涉及 wandb 集成和分布式训练的开发者,推荐精读此 PR,以学习如何处理指标上传的时机问题。特别关注 reinit_wandb_primary_with_open_metrics 函数的设计。

2026-03-25

#1765 sync internal bugfix

作者 zhuzilin · 合并时间 2026-03-25 15:03

缺陷修复 重要性 5.00 洞察度 4.00

修复参数调用并启用SGLang JIT优化。

该PR变更较为简单,工程师无需深度精读,但可关注将位置参数改为关键字参数的设计决策,这提升了代码可读性和维护性;同时,环境变量调整涉及性能优化,值得在类似配置中借鉴。

2026-03-23

参与讨论