Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 10:11 同步状态:空闲 下次计划:2026-06-07 11:11

PR 列表

更多筛选
2026-05-27

#26390 [NPU] fix CI

原始 PR · 作者 Makcum888e · 合并时间 2026-05-27 14:45

基础设施 重要性 3.01 洞察度 4.00

NPU CI 因 torchaudio 依赖位置调整修复

PR 较小,但展示了依赖管理的最佳实践:将版本敏感的依赖从项目元数据中剥离,交由 CI 脚本按环境动态安装。值得阅读 review 中的讨论。

#26435 [Misc] Update CI Permission

原始 PR · 作者 Fridge003 · 合并时间 2026-05-27 10:57

基础设施 重要性 2.97 洞察度 1.00

更新 CI 权限配置,新增用户权限条目

该 PR 为常规维护性变更,无需精读。关注点在于 CI 权限管理流程。

缺陷修复 重要性 7.68 洞察度 5.00

修复 Mooncake Dummy Client 模式未包含 Mamba 混合缓冲区

建议阅读:对于使用 Mooncake 分布式缓存或关注 HiCache 功能的开发者,该 PR 展示了如何处理跨进程共享内存边界计算。特别是 `_standalone_required_bytes` 的设计体现了对多种内存池结构的兼容。新增的测试模式(伪造模块注入)值得借鉴。

性能优化 重要性 5.61 洞察度 4.00

维护 req_pool_indices 的 CPU 镜像,消除 Hisparse 每 decode 的 D2H 复制

建议团队关注此 PR 的实现思路:通过维护 CPU 镜像来避免设备-主机同步,是常见的性能优化模式。对后续调度系统优化有参考价值。

功能 重要性 7.31 洞察度 4.00

添加 mooncake_tcp 传输后端,通过 TCP 替代 RDMA

建议重点理解以下设计决策: - 选择别名而非独立 TCP 后端,避免 GPU 同步复杂性。 - 参数规范化钩子的模块化模式,便于维护和测试。 - 使用 `os.environ.setdefault` 传递环境变量的灵活性。

基础设施 重要性 6.38 洞察度 5.00

XPU CI测试迁移至注册架构,实现分阶段流水线

值得相关维护者精读,了解如何将CI测试对接注册体系。对于后续XPU测试的添加,应参照此模式。设计上烟雾测试与主测试分离的思路值得借鉴。

参与讨论