Prhub
← 返回仓库详情

标签聚合

THUDM/slime · 标签视图

标签列表

聚合结果

docker 相关 PR

2026-04-07

#1813 [conda] Add install custom sgl-router to build_conda.sh

作者 zhuzilin · 合并时间 2026-04-07 15:06

基础设施 重要性 3.00 洞察度 2.00

在conda构建脚本中添加自定义sgl-router安装命令以支持R3功能。

configuration dependency docker

该PR变更简单直接,无需深入代码审查。建议: 1. **基础设施维护者**:关注该行命令的长期维护,未来sgl-router更新时需同步更新版本。 2. **新用户**:如果遇到conda环境构建问题,可检查该依赖安装是否成功。 3. **架构学习者**:可结合PR #1773(移除slime_router)和PR #1770(切换Docker依赖)理解完整的router架构迁移脉络。

#1750 feat: add npu patch for qwen3-vl-8b grpo & ppo

作者 cjy0x · 合并时间 2026-04-07 11:19

功能 重要性 7.00 洞察度 5.00

添加NPU补丁以支持Qwen3-VL-8B模型的GRPO和PPO训练。

feature configuration docker multimodal

该PR值得精读,特别是对于涉及硬件适配或多模态训练的工程师。重点关注: 1. `slime.patch`中的资源分配逻辑变更,如Ray API替换,这可能影响分布式训练稳定性。 2. 补丁中的手动代码替换(如cuda→npu),需理解其背后的兼容性设计决策。 3. 环境配置和版本依赖,以评估部署可行性。建议结合README.md进行实操验证。

2026-03-29

#1777 [release] bump to v0.2.4

作者 zhuzilin · 合并时间 2026-03-29 20:17

基础设施 重要性 5.00 洞察度 3.00

发布新版本v0.2.4,更新megatron和sglang patch文件。

dependency configuration docker

对于技术管理者,此PR是例行发布,建议关注megatron.patch中的设计变更,确保旋转位置编码逻辑正确。工程师可精读patch文件以理解底层优化,并验证相关功能。

2026-03-27

#1772 [docker] update sgl-router

作者 zhuzilin · 合并时间 2026-03-27 14:47

基础设施 重要性 3.00 洞察度 2.00

更新Dockerfile中的sgl-router依赖至新构建版本。

docker dependency configuration

此PR变更简单,主要为依赖更新,无需深入精读。建议关注后续PR中sgl-router相关变更(如PR#1770),以了解依赖演进和潜在影响。

2026-03-26

#1770 use zhuzilin/sgl-router for sglang-router

作者 zhuzilin · 合并时间 2026-03-26 17:07

基础设施 重要性 3.00 洞察度 2.00

将 sglang-router 依赖切换为自定义版本,并更新文档以简化配置要求。

docker dependency

该 PR 值得精读,特别是文档变更部分,以了解 R3 功能的新配置要求;依赖变更部分需要关注自定义源是否稳定,建议在部署前测试新版本兼容性。

2026-03-20

#1743 [docker] update sglang patch

作者 zhuzilin · 合并时间 2026-03-20 14:59

基础设施 重要性 3.00 洞察度 2.00

更新Docker环境中的SGLang补丁至新版本,同步上游修复。

docker dependency bugfix

建议关注补丁内容,特别是decode.py和model_config.py的变更,以理解SGLang的行为变化;对于使用slime的docker部署,建议在测试环境中验证后再部署到生产环境,确保兼容性。

2026-03-18

#1736 [docker] Fix IndexCache with mla model

作者 zhuzilin · 合并时间 2026-03-18 11:32

缺陷修复 重要性 4.00 洞察度 4.00

修复Docker环境中mla模型IndexCache的bug,更新SGLang补丁和版本号。

docker bugfix dependency

建议精读docker/patch/latest/sglang.patch的变更,了解mla模型中IndexCache的修复机制,这对理解SGLang的注意力优化有价值。

#1729 [docker] update megatron

作者 zhuzilin · 合并时间 2026-03-18 10:32

缺陷修复 重要性 5.00 洞察度 4.00

更新SGLang补丁并禁用路由器断路器,修复RDMA会话中断问题。

docker bugfix dependency configuration

建议涉及RDMA或路由器配置的工程师精读此PR,关注slime/ray/rollout.py中的设计决策,特别是禁用断路器的权衡,以确保理解潜在风险。