Prhub
← 返回仓库详情

标签聚合

THUDM/slime · 标签视图

标签列表

聚合结果

dependency 相关 PR

2026-04-07

#1813 [conda] Add install custom sgl-router to build_conda.sh

作者 zhuzilin · 合并时间 2026-04-07 15:06

基础设施 重要性 3.00 洞察度 2.00

在conda构建脚本中添加自定义sgl-router安装命令以支持R3功能。

configuration dependency docker

该PR变更简单直接,无需深入代码审查。建议: 1. **基础设施维护者**:关注该行命令的长期维护,未来sgl-router更新时需同步更新版本。 2. **新用户**:如果遇到conda环境构建问题,可检查该依赖安装是否成功。 3. **架构学习者**:可结合PR #1773(移除slime_router)和PR #1770(切换Docker依赖)理解完整的router架构迁移脉络。

2026-03-29

#1777 [release] bump to v0.2.4

作者 zhuzilin · 合并时间 2026-03-29 20:17

基础设施 重要性 5.00 洞察度 3.00

发布新版本v0.2.4,更新megatron和sglang patch文件。

dependency configuration docker

对于技术管理者,此PR是例行发布,建议关注megatron.patch中的设计变更,确保旋转位置编码逻辑正确。工程师可精读patch文件以理解底层优化,并验证相关功能。

2026-03-27

#1773 refactor: remove slime router

作者 zhuzilin · 合并时间 2026-03-27 16:57

重构 重要性 6.00 洞察度 5.00

移除过时的slime router,统一使用sglang_router以简化架构。

architecture configuration dependency docs

建议阅读slime/ray/rollout.py中的_start_router函数变更,以理解router启动逻辑的统一化设计;同时关注slime/utils/arguments.py的弃用处理,学习向后兼容的最佳实践。此PR值得精读,因为它揭示了架构演进方向。

#1772 [docker] update sgl-router

作者 zhuzilin · 合并时间 2026-03-27 14:47

基础设施 重要性 3.00 洞察度 2.00

更新Dockerfile中的sgl-router依赖至新构建版本。

docker dependency configuration

此PR变更简单,主要为依赖更新,无需深入精读。建议关注后续PR中sgl-router相关变更(如PR#1770),以了解依赖演进和潜在影响。

2026-03-26

#1770 use zhuzilin/sgl-router for sglang-router

作者 zhuzilin · 合并时间 2026-03-26 17:07

基础设施 重要性 3.00 洞察度 2.00

将 sglang-router 依赖切换为自定义版本,并更新文档以简化配置要求。

docker dependency

该 PR 值得精读,特别是文档变更部分,以了解 R3 功能的新配置要求;依赖变更部分需要关注自定义源是否稳定,建议在部署前测试新版本兼容性。

#1768 Fix uploading sglang metrics to wandb

作者 zhuzilin · 合并时间 2026-03-26 13:23

缺陷修复 重要性 5.00 洞察度 5.00

修复 wandb 初始化时机问题,确保 SGLang 指标正确上传。

dependency metrics wandb

对于涉及 wandb 集成和分布式训练的开发者,推荐精读此 PR,以学习如何处理指标上传的时机问题。特别关注 reinit_wandb_primary_with_open_metrics 函数的设计。

2026-03-22

#1714 fix: http_utils. disable system proxy for internal SGLang httpx clients

作者 DongzhuoranZhou · 合并时间 2026-03-22 16:27

缺陷修复 重要性 5.00 洞察度 4.00

修复httpx客户端默认使用系统代理导致内部SGLang通信失败的问题。

bugfix dependency configuration

由于变更较小,工程师可快速浏览以理解httpx代理行为;对于涉及集群代理配置的场景,此修复值得参考,建议关注http_utils模块的设计。

#1734 fix: resolve rope_theta from rope_parameters in DeepseekV32Bridge

作者 stevewx · 合并时间 2026-03-22 16:26

缺陷修复 重要性 5.00 洞察度 4.00

修复DeepseekV32Bridge在transformers 5.x下rope_theta解析问题,确保模型兼容性。

bugfix dependency configuration

对于处理transformers兼容性或DeepseekV32模型的开发者,建议阅读此PR以了解属性解析模式。设计决策如使用hasattr和getattr是值得学习的兼容性处理技巧。