迁移Qwen3-Coder文档至docs_new并更新NVIDIA部署指引
建议部署 Qwen3-Coder 的用户和文档维护者精读此 PR。值得关注的设计决策包括:如何在命令生成器中模块化硬件配置(`modelConfigs` 中直接定义 ep),以及移除显式 MoE 后端标志以利用默认值,这降低了用户配置负担。
标签列表
聚合结果
迁移Qwen3-Coder文档至docs_new并更新NVIDIA部署指引
建议部署 Qwen3-Coder 的用户和文档维护者精读此 PR。值得关注的设计决策包括:如何在命令生成器中模块化硬件配置(`modelConfigs` 中直接定义 ep),以及移除显式 MoE 后端标志以利用默认值,这降低了用户配置负担。
将DeepSeek-V4 AMD CI测试迁移到主分支标准镜像
该PR是基础设施改进,没有引入新功能,但对于保持AMD CI的可持续性很重要。建议CI维护者关注工作流变更后的实际运行时间变化,以及测试脚本中的环境变量是否与最新`run_dsv4.sh`保持同步。一般开发者可跳过阅读。
原始 PR · 作者 sglang-bot · 合并时间 2026-05-28 02:31
sglang-kernel 版本从 0.4.2.post2 升级至 0.4.3
该 PR 为常规依赖升级,价值有限。无需精读,但可关注 sglang-kernel 0.4.3 的 release note 了解具体包含的修复或特性。
修复多模态处理器默认使用 GPU 0 的问题
最小侵入修复,逻辑清晰,推荐合并。值得关注的是多 GPU 资源隔离的设计思路:预处理应在当前进程绑定的 GPU 上进行,而非全局默认设备。
引入 stage-a 检测套件并重组测试目录
推荐测试基础设施维护者精读,其 mixin 化设计和共享资源策略值得在大型项目中推广。
原始 PR · 作者 Kangyan-Zhou · 合并时间 2026-05-20 15:20
预置 sgl-router 的 PR 测试 CI 工作流
此 PR 虽仅为一个工作流文件,但其设计思路值得阅读: 1. 提前部署 CI 基础设施,消除大型 PR 的阻塞点。 2. pin-free 安装 vs 固定版本的权衡。 3. 多层流水线 + SHA 校验的供应链安全实践。 4. 使用 continue-on-error 处理 sccache 安装失败,提升 CI 鲁棒性。 对于管理大型工程项目 CI 的读者参考价值高。
重跑测试从 YAML 动态解析 runner 标签
值得所有涉及 CI 维护的开发者精读,学习如何通过 YAML 配置驱动 workflow、移除硬编码表。重点关注 `_extract_runner_config` 的实现和 `rerun-test.yml` 的拆分模式。
修复 fork PR token 与 run-ci 标签感知
可快速合入,提升 fork PR 贡献者体验;拉取 review 时重点确认触发器改动和标签逻辑正确性。