Prhub

sgl-project/sglang · 标签视图

标签列表

聚合结果

mthreads 相关 PR

2026-05-28
2026-05-22

完善MUSA CI:重构wheels元数据、收紧路径过滤、同步测试并添加 nightly 工作流

该 PR 是 CI 基础设施的重要改进,值得 SGLang 其他硬件后端(如 NPU、Intel GPU)参考学习。建议审核者关注路径过滤规则的完备性和 wheel 元数据在不同 Python 打包工具下的兼容性。

2026-05-15

#24978 [MUSA]: Add flashinfer sampling backend

原始 PR · 作者 froststeam · 合并时间 2026-05-15 11:23

功能 重要性 8.15 洞察度 5.00

为 MUSA 添加 FlashInfer 采样后端

值得阅读,特别是对 MUSA 后端的适配方式。设计决策中采用了与 CUDA 后端类似的接口封装,便于未来统一。

2026-05-12
功能 重要性 5.03 洞察度 4.00

MUSA 平台新增 Sage Attention 后端支持

可直接合并。但对于新版 sglang 来说,建议在后续 PR 中添加 Sage Attention 后端的测试覆盖,并在文档中明确说明 Sage Attention 后端的安装要求和性能对比。此外,回退行为可考虑增加 warning 日志,以便用户及时发现配置问题。

功能 重要性 8.25 洞察度 7.00

MUSA 设备启用 piecewise CUDA graph 并优化算子

该 PR 值得精读,特别关注 MUSA 后端的 FX 补丁和 fake kernel 注册模式。对于跨平台算子层的开发者来说,这是一种通用的解决 `torch.compile` 兼容性的方法。PR 中的 review 讨论也提供了良好的代码健壮性实践(使用 `_replace`、`getattr`、条件注册)。建议后续增加 MUSA 硬件上的 CI 测试。

2026-05-08
基础设施 重要性 8.85 洞察度 5.00

为 MUSA 后端添加 CI 测试工作流与单元测试套件

该 PR 是新增硬件后端 CI 基础设施的重要贡献,值得所有关心多后端支持的开发者阅读。特别值得关注的是 `run_suite_musa.py` 的分区执行与失败重试设计,以及基准测试中条件导入 MUSA 核函数以兼容多后端的模式。

功能 重要性 8.86 洞察度 5.00

为 MUSA GPU 添加 sgl-kernel 优化内核

值得精读——尤其是头文件组织方式(`sgl_kernel_musa_ops.h`)和条件编译策略,可作为跨架构支持的样板。建议作者补充单元测试(参考 `test/registered/` 下的模式)并跟进 inter-block barrier 的 long-term 修复。

#24592 [MUSA] Bump torchada to 0.1.54

原始 PR · 作者 yeahdongcn · 合并时间 2026-05-08 02:45

其他 重要性 2.74 洞察度 2.00

MUSA torchada 版本从 0.1.53 升级到 0.1.54

建议合并,确保 MUSA 平台能与上游 CUDA 功能保持同步。合并前可验证 torchada 0.1.54 版本已正确发布且安装无问题。