Prhub

#25209 [AMD] Add amd jit clamp position bench ci

原始 PR 作者 Emmanuel0612 合并时间 2026-05-14 15:03 文件变更 1 提交数 6 评论 1 代码增减 +2 / -1

执行摘要

新增 AMD CI benchmark 注册

为 AMD 设备补全 JIT kernel 的 CI benchmark,之前已有 CUDA 注册,现在需要 AMD 版本。

建议合入。属于标准 CI 接入变更,代码简洁,已验证 AMD 环境通过。

讨论亮点

无 review 评论。

实现拆解

在 python/sglang/jit_kernel/benchmark/bench_clamp_position.py 中:

  1. 导入 register_amd_ci 函数:将 import 行改为 from sglang.test.ci.ci_register import register_amd_ci, register_cuda_ci。
  2. 调用 register_amd_ci:新增 register_amd_ci(est_time=16, suite="jit-kernel-unit-test-amd"),并与原有的 register_cuda_ci 并列。
文件 模块 状态 重要度
python/sglang/jit_kernel/benchmark/bench_clamp_position.py JIT 核 modified 4.19

关键源码片段

python/sglang/jit_kernel/benchmark/bench_clamp_position.py dependency-wiring

单文件变更,添加 AMD CI 注册,使 benchmark 可在 AMD 设备上自动执行。

# bench_clamp_position.py (head)
import itertools
import torch
import triton
import triton.testingfrom sglang.jit_kernel.benchmark.utils import (
    DEFAULT_DEVICE,
    get_benchmark_range,
    run_benchmark,
)
from sglang.jit_kernel.clamp_position import clamp_position_cuda
from sglang.srt.utils import get_compiler_backend
# 同时导入 CUDA 和 AMD 的 CI 注册函数
from sglang.test.ci.ci_register import register_amd_ci, register_cuda_ci# 注册 CUDA CI benchmark
register_cuda_ci(est_time=13, suite="stage-b-kernel-benchmark-1-gpu-large")
# 新增 AMD CI benchmark 注册,预估耗时 16 秒,归入 jit-kernel-unit-test-amd 套件
register_amd_ci(est_time=16, suite="jit-kernel-unit-test-amd")SIZE_LIST = get_benchmark_range(...)
# ... 后续 benchmark 逻辑不变

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

风险很低。仅添加一行注册调用,不影响原逻辑;若 AMD CI 环境缺失依赖可能导致 benchmark 失败,但仅影响 CI 流程。

对用户无直接影响。对 AMD CI 管道增加一个 benchmark 任务(估时 16 秒),提升 JIT kernel 在 AMD 平台上的可观测性。

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论