执行摘要
- 一句话:为 AMD CI 注册 mamba 状态分散测试
- 推荐动作:该 PR 是标准的测试套件扩展,可快速合并。
功能与动机
将 test_mamba_state_scatter_triton.py 注册到 AMD CI 套件中,以在 AMD 平台上覆盖 mamba 状态分散的 Triton 算子。
实现拆解
- 导入变更:在文件
test/registered/unit/layers/test_mamba_state_scatter_triton.py 中,将导入语句从 from sglang.test.ci.ci_register import register_cuda_ci 改为 from sglang.test.ci.ci_register import register_amd_ci, register_cuda_ci。
- 新增 AMD CI 注册:在原有的
register_cuda_ci 调用之后,新增一行 register_amd_ci(est_time=7, suite="stage-b-test-1-gpu-small-amd-mi35x"),将测试注册到 AMD CI 的特定套件。
- 清理无关改动:通过 revert 操作移除了合并时引入的无关文档(index.mdx)变更,确保 PR 仅包含测试配置的修改。
关键文件:
test/registered/unit/layers/test_mamba_state_scatter_triton.py(模块 测试配置;类别 test;类型 test-coverage): 该文件是唯一变更文件:添加了 AMD CI 注册,仅新增一行 register_amd_ci 调用。
关键符号:未识别
关键源码片段
test/registered/unit/layers/test_mamba_state_scatter_triton.py
该文件是唯一变更文件:添加了 AMD CI 注册,仅新增一行 register_amd_ci 调用。
# 文件头部导入及 CI 注册
from sglang.test.ci.ci_register import register_amd_ci, register_cuda_ci
# 保留原有的 CUDA CI 注册
register_cuda_ci(est_time=7, stage="base-b", runner_config="1-gpu-small")
# 新增 AMD CI 注册,指定 suite 名称为 stage-b-test-1-gpu-small-amd-mi35x
register_amd_ci(est_time=7, suite="stage-b-test-1-gpu-small-amd-mi35x")
评论区精华
审核者 HaiShaw 要求将无关的 index.mdx 文件恢复("Please revert index.mdx"),作者 Emmanuel0612 随后执行了 revert,最终获得 HaiShaw 和 yctseng0211 的批准。
- 恢复无关文件 (other): 作者执行了 revert 操作,移除了无关的 index.mdx 变更。
风险与影响
- 风险:风险极低。仅添加了一行 AMD CI 注册调用,未修改任何业务逻辑或测试断言。若 AMD 环境中未正确配置 CI 环境,可能导致该测试被标记为失败,但不会影响其他 CI 任务。
- 影响:影响范围仅限于 CI 系统:该测试现在会在 AMD MI35X 硬件上运行。对用户无直接影响。
- 风险标记:CI 环境依赖, 测试覆盖调整
关联脉络
- PR #27038 [sglang] Fix Mamba COW over-releasing SWA locks (cascade-evict assert crash): 同一代码域(Mamba 状态管理),该 PR 为 Mamba 相关测试增加了 AMD CI 覆盖。
- PR #25093 [AMD] Enable AITER custom all-gather on ROCm: 都是 AMD 平台能力增强的 CI 配套工作,属于同一基础设施方向。
参与讨论