Prhub
← 返回仓库列表

THUDM/slime

slime is an LLM post-training framework for RL Scaling.

监控状态:已开启 最近同步:2026-04-18 18:18 同步状态:空闲 下次计划:2026-04-18 19:18

PR 列表

已合并 52 · 已分析 52
更多筛选 · 已设定
✕ 清空

当前筛选范围内没有 PR。

参与讨论