Prhub
← 返回仓库列表

THUDM/slime

slime is an LLM post-training framework for RL Scaling.

监控状态:已开启 最近同步:2026-04-18 18:18 同步状态:空闲 下次计划:2026-04-18 19:18

PR 列表

已合并 52 · 已分析 52
更多筛选
2026-03-18

#1736 [docker] Fix IndexCache with mla model

作者 zhuzilin · 合并时间 2026-03-18 11:32

缺陷修复 重要性 4.00 洞察度 4.00

修复Docker环境中mla模型IndexCache的bug,更新SGLang补丁和版本号。

建议精读docker/patch/latest/sglang.patch的变更,了解mla模型中IndexCache的修复机制,这对理解SGLang的注意力优化有价值。

#1729 [docker] update megatron

作者 zhuzilin · 合并时间 2026-03-18 10:32

缺陷修复 重要性 5.00 洞察度 4.00

更新SGLang补丁并禁用路由器断路器,修复RDMA会话中断问题。

建议涉及RDMA或路由器配置的工程师精读此PR,关注slime/ray/rollout.py中的设计决策,特别是禁用断路器的权衡,以确保理解潜在风险。

2026-03-17

#1731 Fix CUDA IPC cache leaks during weight updates

作者 zhuzilin · 合并时间 2026-03-17 10:37

缺陷修复 重要性 6.00 洞察度 6.00

修复权重更新中的CUDA IPC缓存泄漏,防止GPU内存累积。

对于涉及GPU内存管理或权重更新模块的工程师,建议精读此PR以学习CUDA IPC泄漏的修复技巧;对于一般读者,可关注变更点以规避类似的内存管理问题。

2026-03-13

参与讨论