Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 12:34 同步状态:空闲 下次计划:2026-06-07 13:34

PR 列表

更多筛选
2026-05-14
基础设施 重要性 7.05 洞察度 6.00

CI 测试分区基于实时性能数据动态调整

值得精读,因为它实现了一个实用的动态 CI 分区策略,并展示了如何安全地集成外部数据源。设计选择(SHA 固定、逐步回退、基于 OLS 的性能建模)对于构建可靠的自动化系统有借鉴意义。

#25268 [NPU] [DOC] fix issues in ascend npu docs

原始 PR · 作者 amote-i · 合并时间 2026-05-14 17:25

文档 重要性 4.22 洞察度 2.00

修复 Ascend NPU 文档 MDX 渲染、镜像地址及推荐模型

该 PR 质量合格,文档修复覆盖全面,且 AI 审查发现的表格问题已在合并前修正。建议合并。若团队维护多个文档版本,需注意同步更新。

功能 重要性 9.13 洞察度 8.00

添加 --model-config-parser 注册表,支持自定义配置格式

建议精读。该 PR 展示了良好的扩展点设计(注册表 + 抽象基类),详细的向后兼容性分析(Mistral 检测),以及干净的代码迁移(get_config 拆分为独立解析器)。是 sglang 配置系统架构演进的重要一步。

缺陷修复 重要性 7.08 洞察度 5.00

同步多节点 prefill bootstrap 端口,修复跨节点注册失败

此 PR 修复了多节点 disagg 部署中的静默故障,设计简洁高效。建议阅读 `_sync_bootstrap_port_across_nodes` 方法,了解如何使用 `torch.distributed.broadcast_object` 实现跨节点配置同步,这种 Leader 广播模式在分布式系统中很有参考价值。

基础设施 重要性 5.24 洞察度 5.00

将 9 个独立输入打包为 2 个 JSON 输入,简化 CI 工作流调用

值得阅读。该 PR 展示了 GitHub Actions 工作流中通过 JSON 打包输入来简化多参数传递的设计模式,同时提供了验证等价性的方法。适合负责 CI 维护的工程师参考。

基础设施 重要性 5.84 洞察度 4.00

CI 脚本改为集中 model.json 数据源

建议 CI 相关开发者阅读此 PR,理解集中式数据源的设计思路——将不同工具的统计模型统一从 `sglang-ci-stats` 获取,消除重复抓取和数据不一致。关注 `fetch_model` 的容错策略和边界条件的处理方式。

参与讨论