THUDM/slime

slime is an LLM post-training framework for RL Scaling.

监控状态：已开启最近同步：2026-04-18 18:18 同步状态：空闲下次计划：2026-04-18 19:18

PR 列表

已合并 52 · 已分析 52

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-03-18

作者 zhuzilin · 合并时间 2026-03-18 11:32

缺陷修复重要性 4.00 洞察度 4.00

修复Docker环境中mla模型IndexCache的bug，更新SGLang补丁和版本号。

建议精读docker/patch/latest/sglang.patch的变更，了解mla模型中IndexCache的修复机制，这对理解SGLang的注意力优化有价值。

查看完整分析 GitHub 原始 PR dockerbugfixdependency

作者 zhuzilin · 合并时间 2026-03-18 10:32

缺陷修复重要性 5.00 洞察度 4.00

更新SGLang补丁并禁用路由器断路器，修复RDMA会话中断问题。

建议涉及RDMA或路由器配置的工程师精读此PR，关注slime/ray/rollout.py中的设计决策，特别是禁用断路器的权衡，以确保理解潜在风险。

查看完整分析 GitHub 原始 PR dockerbugfixdependency

2026-03-17

作者 zhuzilin · 合并时间 2026-03-17 10:37

缺陷修复重要性 6.00 洞察度 6.00

修复权重更新中的CUDA IPC缓存泄漏，防止GPU内存累积。

对于涉及GPU内存管理或权重更新模块的工程师，建议精读此PR以学习CUDA IPC泄漏的修复技巧；对于一般读者，可关注变更点以规避类似的内存管理问题。

查看完整分析 GitHub 原始 PR bugfixperformancedependency

2026-03-13

作者 zhuzilin · 合并时间 2026-03-13 15:16

基础设施重要性 5.00 洞察度 4.00

更新 Docker 补丁以支持 GLM4.6V 和 Kimi K2.5 模型，并优化 DSA CP 逻辑。

建议技术管理者和工程师精读 sglang.patch 中的调度器变更，以理解分布式训练中 CP 和 TP 分组的设计权衡，以及错误处理策略的调整。

查看完整分析 GitHub 原始 PR dockerperformanceconfiguration

第 7 / 7 页 · 共 52 条

上一页 1 2 3 4 5 6 7