#26437 [MUSA] Fix startup with patched torchada
原始 PR · 作者 popsiclexu · 合并时间 2026-05-28 20:57
修复 MUSA 启动时 torchada 兼容性问题
建议快速合并,属于紧急平台兼容性修复。
标签列表
聚合结果
原始 PR · 作者 popsiclexu · 合并时间 2026-05-28 20:57
修复 MUSA 启动时 torchada 兼容性问题
建议快速合并,属于紧急平台兼容性修复。
完善MUSA CI:重构wheels元数据、收紧路径过滤、同步测试并添加 nightly 工作流
该 PR 是 CI 基础设施的重要改进,值得 SGLang 其他硬件后端(如 NPU、Intel GPU)参考学习。建议审核者关注路径过滤规则的完备性和 wheel 元数据在不同 Python 打包工具下的兼容性。
原始 PR · 作者 froststeam · 合并时间 2026-05-15 11:23
为 MUSA 添加 FlashInfer 采样后端
值得阅读,特别是对 MUSA 后端的适配方式。设计决策中采用了与 CUDA 后端类似的接口封装,便于未来统一。
原始 PR · 作者 yeahdongcn · 合并时间 2026-05-12 10:50
MUSA 平台新增 Sage Attention 后端支持
可直接合并。但对于新版 sglang 来说,建议在后续 PR 中添加 Sage Attention 后端的测试覆盖,并在文档中明确说明 Sage Attention 后端的安装要求和性能对比。此外,回退行为可考虑增加 warning 日志,以便用户及时发现配置问题。
原始 PR · 作者 popsiclexu · 合并时间 2026-05-12 08:55
MUSA 设备启用 piecewise CUDA graph 并优化算子
该 PR 值得精读,特别关注 MUSA 后端的 FX 补丁和 fake kernel 注册模式。对于跨平台算子层的开发者来说,这是一种通用的解决 `torch.compile` 兼容性的方法。PR 中的 review 讨论也提供了良好的代码健壮性实践(使用 `_replace`、`getattr`、条件注册)。建议后续增加 MUSA 硬件上的 CI 测试。
为 MUSA 后端添加 CI 测试工作流与单元测试套件
该 PR 是新增硬件后端 CI 基础设施的重要贡献,值得所有关心多后端支持的开发者阅读。特别值得关注的是 `run_suite_musa.py` 的分区执行与失败重试设计,以及基准测试中条件导入 MUSA 核函数以兼容多后端的模式。
原始 PR · 作者 Joey-gvwal · 合并时间 2026-05-08 11:38
为 MUSA GPU 添加 sgl-kernel 优化内核
值得精读——尤其是头文件组织方式(`sgl_kernel_musa_ops.h`)和条件编译策略,可作为跨架构支持的样板。建议作者补充单元测试(参考 `test/registered/` 下的模式)并跟进 inter-block barrier 的 long-term 修复。
原始 PR · 作者 yeahdongcn · 合并时间 2026-05-08 02:45
MUSA torchada 版本从 0.1.53 升级到 0.1.54
建议合并,确保 MUSA 平台能与上游 CUDA 功能保持同步。合并前可验证 torchada 0.1.54 版本已正确发布且安装无问题。