#26390 [NPU] fix CI
原始 PR · 作者 Makcum888e · 合并时间 2026-05-27 14:45
NPU CI 因 torchaudio 依赖位置调整修复
PR 较小,但展示了依赖管理的最佳实践:将版本敏感的依赖从项目元数据中剥离,交由 CI 脚本按环境动态安装。值得阅读 review 中的讨论。
SGLang is a high-performance serving framework for large language models and multimodal models.
原始 PR · 作者 Makcum888e · 合并时间 2026-05-27 14:45
NPU CI 因 torchaudio 依赖位置调整修复
PR 较小,但展示了依赖管理的最佳实践:将版本敏感的依赖从项目元数据中剥离,交由 CI 脚本按环境动态安装。值得阅读 review 中的讨论。
原始 PR · 作者 yctseng0211 · 合并时间 2026-05-27 13:55
AMD CI 默认 runner 临时切换为 mi325
简单基础设施变更,无需深入审查。建议关注后续是否切换回 mi300 或长期稳定在 mi325。
NPU 设备禁用 torch.compile 避免运行时错误
该 PR 是 NPU 平台适配的合理修复,值得合并。建议阅读以了解设备特异性编译处理模式,但无需精读。
更新 CI 权限配置,新增用户权限条目
该 PR 为常规维护性变更,无需精读。关注点在于 CI 权限管理流程。
原始 PR · 作者 stmatengss · 合并时间 2026-05-27 10:29
修复 Mooncake Dummy Client 模式未包含 Mamba 混合缓冲区
建议阅读:对于使用 Mooncake 分布式缓存或关注 HiCache 功能的开发者,该 PR 展示了如何处理跨进程共享内存边界计算。特别是 `_standalone_required_bytes` 的设计体现了对多种内存池结构的兼容。新增的测试模式(伪造模块注入)值得借鉴。
维护 req_pool_indices 的 CPU 镜像,消除 Hisparse 每 decode 的 D2H 复制
建议团队关注此 PR 的实现思路:通过维护 CPU 镜像来避免设备-主机同步,是常见的性能优化模式。对后续调度系统优化有参考价值。
添加 mooncake_tcp 传输后端,通过 TCP 替代 RDMA
建议重点理解以下设计决策: - 选择别名而非独立 TCP 后端,避免 GPU 同步复杂性。 - 参数规范化钩子的模块化模式,便于维护和测试。 - 使用 `os.environ.setdefault` 传递环境变量的灵活性。
原始 PR · 作者 vshekhawat-hlab · 合并时间 2026-05-27 08:56
XPU CI测试迁移至注册架构,实现分阶段流水线
值得相关维护者精读,了解如何将CI测试对接注册体系。对于后续XPU测试的添加,应参照此模式。设计上烟雾测试与主测试分离的思路值得借鉴。
参与讨论