#25335 [Fix] Fix gpt oss triton kernels and upgrade flashinfer back to 0.6.11.post1

原始 PR 作者 Fridge003 合并时间 2026-05-15 16:04 文件变更 13 提交数 5 评论 8 代码增减 +147 / -53

执行摘要

升级 FlashInfer 至 0.6.11.post1 并修复 GPT OSS Triton 内核适配问题

PR 基于 #25312 修改，主要因为 FlashInfer 0.6.11.post1 对 triton_kernels 的 API 进行了向后不兼容的变更（如 routing 和 topk 接口拆分），同时 SM120 Blackwell GPU 上的 MXFP4 计算需要绕过非持久化 kernel 的 warp 数量不足问题。此外，由于之前某种原因跳过的 CI 测试需要恢复，并确保与新版 FlashInfer 兼容。

建议阅读。此 PR 展示了升级第三方依赖时如何系统性地进行适配，包括 monkey-patch 权衡、分布式通信参数安全注入、以及库检测增强。对于使用 FlashInfer 或 MXFP4 的团队，理解这里的适配模式有助于应对未来版本变更。

讨论亮点

reviewer mmangkad 在评论中提到 FlashInfer 0.6.11.post2 已发布并包含更多 bug 修复，询问是否升级至此版本。作者 Fridge003 回应可以另开 PR 处理，表示当前 PR 先专注于 0.6.11.post1。

实现拆解

升级依赖与版本号：在 python/pyproject.toml 中将 flashinfer 版本约束更新至 0.6.11.post1，同步更新 sglang-kernel 版本至 0.4.2.post2（entrypoints/engine.py 和 Dockerfile 随之更新）。
SM120 MXFP4 内核修复：在 mxfp4.py 中新增 _patch_sm120_mxfp4_min_warps 函数，当检测到 SM120（桌面 Blackwell）的 MXFP4 使用非持久化 StridedLayout 时，通过 monkey-patch opt_flags_nvidia.compute_num_warps 确保 warp 数至少为 4，避免因 warp 不足导致的 kernel 启动失败。同时去掉了 block_k=128 的硬约束，由补丁动态保证。
Routing 函数重构：在 topk.py 中，将导入从 triton_kernels.routing 改为 triton_kernels.matmul_ogs 与 triton_kernels.topk，并利用新的 triton_kernels_topk 接口重新实现 routing 函数，显式处理 simulated_ep 参数（暂不支持时抛异常）。GatherIndx、RoutingData、ScatterIndx 等类型也从新位置导入。
FlashInfer 通信融合适配：在 flashinfer_comm_fusion.py 中，向 create_allreduce_fusion_workspace 调用新增 group=device_group 参数，并将 ensure_workspace_initialized 中的 device_group/cpu_group 设置从条件判断（当子组等于全 TP 组时传 None）改为始终传递协调器的实际组，防止 FlashInfer >=0.6.10 回退至 WORLD 导致挂起。
库可用性检测增强：在 common.py 中，is_triton_kernels_available 从简单检查 triton_kernels 顶层模块改为额外验证 triton_kernels.tensor_details.ragged_tensor 子模块存在，防止因部分安装导致的运行时错误。
其他适配：fused_moe_triton/triton_kernels_moe.py 和 moe_runner/triton_kernels.py 中的 TYPE_CHECKING 导入路径同步更新；fp4_utils.py 中调用 _flashinfer_fp4_quantize 时改为关键字传参并添加 backend 参数；恢复之前跳过的 CI 测试（test_mxfp4_sm90_cutlass.py、test_deepseek_v4_flash_fp4_h200.py）。

文件	模块	状态	重要度
`python/sglang/srt/layers/quantization/mxfp4.py`	量化层	modified	7.57
`python/sglang/srt/layers/moe/topk.py`	路由层	modified	7.19
`python/sglang/srt/layers/flashinfer_comm_fusion.py`	通信融合	modified	6.29

关键符号

_patch_sm120_mxfp4_min_warps _compute_num_warps_sm120_mxfp4 routing is_triton_kernels_available

关键源码片段

python/sglang/srt/layers/quantization/mxfp4.py core-logic

核心修复 SM120 Blackwell 上 MXFP4 kernel 的 warp 不足问题，通过 monkey-patch 动态调整 compute_num_warps。

# 文件 : python/sglang/srt/layers/quantization/mxfp4.py
# 新增模块级标志，避免重复打补丁
_sm120_mxfp4_min_warps_patched = False

def _patch_sm120_mxfp4_min_warps():
    """为 SM120 Blackwell GPU 的 MXFP4 计算路径打补丁，
    确保当使用非持久化 StridedLayout 时 warp 数至少为 4。"""
    global _sm120_mxfp4_min_warps_patched
    if _sm120_mxfp4_min_warps_patched:
        return

    import inspect
    from triton_kernels.matmul_ogs_details.opt_flags_details import opt_flags_nvidia
    from triton_kernels.tensor import get_layout
    from triton_kernels.tensor_details.layout import StridedLayout

    # 引用原厂 compute_num_warps 函数
    compute_num_warps = opt_flags_nvidia.compute_num_warps
    params = inspect.signature(compute_num_warps).parameters

    # 仅当原始函数具有 is_persistent 参数且尚未打补丁时注入
    if "is_persistent" in params and not getattr(
        compute_num_warps, "_sglang_sm120_mxfp4_patch", False
    ):

        def _compute_num_warps_sm120_mxfp4(
            block_m, block_n, is_persistent, precision_config
        ):
            # 先调用原始函数获得默认 warp 数
            selected_num_warps = compute_num_warps(
                block_m, block_n, is_persistent, precision_config
            )
            # 检查是否使用了 StridedLayout 的 weight_scale
            weight_scale = getattr(precision_config, "weight_scale", None)
            weight_scale_layout = get_layout(weight_scale)
            if (
                not is_persistent
                and weight_scale is not None
                and (
                    weight_scale_layout is StridedLayout
                    or isinstance(weight_scale_layout, StridedLayout)
                )
            ):
                # SM120 非持久化路径需要至少 4 个 warp
                return max(selected_num_warps, 4)
            return selected_num_warps

        # 标记已打补丁，避免重复替换
        _compute_num_warps_sm120_mxfp4._sglang_sm120_mxfp4_patch = True
        opt_flags_nvidia.compute_num_warps = _compute_num_warps_sm120_mxfp4

    _sm120_mxfp4_min_warps_patched = True

# 在 _swizzle_mxfp4 函数中调用补丁注册
def _swizzle_mxfp4(quant_tensor, scale, num_warps):
    """weight swizzle for mxfp4 moe, used for OAI mxfp4 kernel"""
    import triton_kernels.matmul_ogs_details.opt_flags as opt_flags
    from triton_kernels.numerics import InFlexData
    from triton_kernels.tensor import FP4, convert_layout, wrap_torch_tensor
    from triton_kernels.tensor_details import layout

    if is_sm120_supported():
        _patch_sm120_mxfp4_min_warps() # 在 SM120 路径中确保补丁已应用
        from triton_kernels.tensor_details.layout import StridedLayout
        # ... 其余 StridedLayout 设置

python/sglang/srt/layers/moe/topk.py dependency-wiring

重写 routing 函数，适配新版 triton_kernels 的独立 topk 接口，替换已废弃的 routing 导入。

# 文件 : python/sglang/srt/layers/moe/topk.py
# 在原有 try 块中重新定义 import 和 routing 函数
try:
    from triton_kernels.matmul_ogs import GatherIndx, RoutingData, ScatterIndx
    from triton_kernels.tensor import make_ragged_tensor_metadata
    from triton_kernels.topk import topk as triton_kernels_topk

    def routing(
        logits,
        n_expts_act,
        sm_first=False,
        expt_indx=None,
        simulated_ep=1,
        n_rows=None,
    ):
        """兼容 triton_kernels 3.6.0 的 routing 实现，使用独立的 topk 接口。"""
        if simulated_ep != 1:
            raise NotImplementedError(
                "simulated_ep routing is not supported with triton_kernels 3.6.0"
            )

        if sm_first:
            logits = torch.softmax(logits, dim=-1)

        sparse_logits = triton_kernels_topk(
            logits,
            n_expts_act,
            apply_softmax=not sm_first,
            y_indx=expt_indx,
            n_rows=n_rows,
        )
        dispatch_indx = sparse_logits.mask_metadata.row_sorted_indx
        combine_indx = sparse_logits.mask_metadata.col_sorted_indx
        ragged_metadata = make_ragged_tensor_metadata(
            sparse_logits.mask_metadata.col_sum, dispatch_indx.shape[0]
        )
        gate_scal = sparse_logits.vals.flatten()[combine_indx]
        routing_data = RoutingData(
            gate_scal,
            ragged_metadata.slice_sizes,
            logits.shape[-1],
            n_expts_act,
            ragged_metadata,
        )
        gather_indx = GatherIndx(combine_indx, dispatch_indx)
        scatter_indx = ScatterIndx(dispatch_indx, combine_indx)
        return routing_data, gather_indx, scatter_indx

except ImportError:
    pass

python/sglang/srt/layers/flashinfer_comm_fusion.py core-logic

修复 FlashInfer >=0.6.10 在 TP/EP/CP 子组中通信回退到 WORLD 导致挂起的问题，强制传递 group 参数。

# 文件 : python/sglang/srt/layers/flashinfer_comm_fusion.py
# 在 initialize 方法中创建 workspace 时传入 group 参数
kwargs = dict(
    backend="trtllm",
    world_size=world_size,
    rank=rank,
    max_token_num=max_token_num,
    hidden_dim=hidden_dim,
    dtype=dtype,
    force_oneshot_support=bool(use_oneshot),
    # Pin the symmetric-memory rendezvous to the actual subgroup.
    # Without this, flashinfer >=0.6.10 falls back to WORLD and
    # TP/EP/CP subgroup peers get addressed incorrectly (kernel hangs
    # in cuda-graph warmup).
    group=device_group,
)

# 在 ensure_workspace_initialized 中移除 tp_coordinator 比较逻辑
# 始终从 coordinator 获取实际组，确保子组通信正确
# 变更前：当子组等于全 TP 组时传 None，否则传 coordinator 的组
# 变更后：始终传递 coordinator.device_group 和 coordinator.cpu_group
# 这样 flashinfer 的对称内存 rendezvous 会使用正确的子组而非 WORLD
device_group = coordinator.device_group
cpu_group = coordinator.cpu_group

评论区精华

是否升级到 FlashInfer 0.6.11.post2 question

reviewer mmangkad 询问是否应该直接升级到包含更多 bug 修复的 0.6.11.post2 版本。

结论：作者 Fridge003 认为当前 PR 先专注于 0.6.11.post1，升级到 post2 可另开 PR 处理。 · 已解决

风险与影响

依赖兼容性：升级 flashinfer 为 0.6.11.post1 可能与旧版本不兼容，但 PR 已修改了所有使用点。若用户环境锁定旧 flashinfer，升级后需同步更新。
SM120 路径风险：_patch_sm120_mxfp4_min_warps 通过 monkey-patch 修改第三方库的 compute_num_warps，若 triton_kernels 版本更新可能失效。但补丁通过检查 is_persistent 参数存在性来安全启用，并设置了哨兵属性避免重复打补丁。
分布式通信风险：强制传递 group 参数可能在不支持的 flashinfer 版本上失败，但 ensure_workspace_initialized 有异常捕获兜底，失败后会全局禁用 fusion。
部分安装检测：is_triton_kernels_available 新增子模块检查，但若 triton_kernels 安装但子模块缺失（如旧版本），功能将自动降级，不会直接崩溃。

影响范围：涉及所有使用 MXFP4 量化（特别是 SM90/100/120 GPU）和 FlashInfer 通信融合的模型，如 DeepSeek、GPT OSS 等。用户需要更新 flashinfer 至 0.6.11.post1（pip install flashinfer-python>=0.6.11.post1）。分布式场景下（TP/EP/CP 子组）的通信融合正确性依赖本次修复。同时，之前因不兼容而跳过的 CI 测试（MXFP4 cutlass、DeepSeek V4 FP4 H200）恢复运行，表明这些功能恢复正常。

依赖升级 monkey-patch 第三方库分布式通信子组依赖 CI 测试恢复可能暴露新问题

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接，后续同步到相关引用后会出现在这里。

完整报告

执行摘要

一句话：升级 FlashInfer 至 0.6.11.post1 并修复 GPT OSS Triton 内核适配问题
推荐动作：建议阅读。此 PR 展示了升级第三方依赖时如何系统性地进行适配，包括 monkey-patch 权衡、分布式通信参数安全注入、以及库检测增强。对于使用 FlashInfer 或 MXFP4 的团队，理解这里的适配模式有助于应对未来版本变更。

功能与动机

实现拆解

升级依赖与版本号：在 python/pyproject.toml 中将 flashinfer 版本约束更新至 0.6.11.post1，同步更新 sglang-kernel 版本至 0.4.2.post2（entrypoints/engine.py 和 Dockerfile 随之更新）。
SM120 MXFP4 内核修复：在 mxfp4.py 中新增 _patch_sm120_mxfp4_min_warps 函数，当检测到 SM120（桌面 Blackwell）的 MXFP4 使用非持久化 StridedLayout 时，通过 monkey-patch opt_flags_nvidia.compute_num_warps 确保 warp 数至少为 4，避免因 warp 不足导致的 kernel 启动失败。同时去掉了 block_k=128 的硬约束，由补丁动态保证。
Routing 函数重构：在 topk.py 中，将导入从 triton_kernels.routing 改为 triton_kernels.matmul_ogs 与 triton_kernels.topk，并利用新的 triton_kernels_topk 接口重新实现 routing 函数，显式处理 simulated_ep 参数（暂不支持时抛异常）。GatherIndx、RoutingData、ScatterIndx 等类型也从新位置导入。
FlashInfer 通信融合适配：在 flashinfer_comm_fusion.py 中，向 create_allreduce_fusion_workspace 调用新增 group=device_group 参数，并将 ensure_workspace_initialized 中的 device_group/cpu_group 设置从条件判断（当子组等于全 TP 组时传 None）改为始终传递协调器的实际组，防止 FlashInfer >=0.6.10 回退至 WORLD 导致挂起。
库可用性检测增强：在 common.py 中，is_triton_kernels_available 从简单检查 triton_kernels 顶层模块改为额外验证 triton_kernels.tensor_details.ragged_tensor 子模块存在，防止因部分安装导致的运行时错误。
其他适配：fused_moe_triton/triton_kernels_moe.py 和 moe_runner/triton_kernels.py 中的 TYPE_CHECKING 导入路径同步更新；fp4_utils.py 中调用 _flashinfer_fp4_quantize 时改为关键字传参并添加 backend 参数；恢复之前跳过的 CI 测试（test_mxfp4_sm90_cutlass.py、test_deepseek_v4_flash_fp4_h200.py）。

关键文件：

python/sglang/srt/layers/quantization/mxfp4.py（模块量化层；类别 source；类型 core-logic；符号 _patch_sm120_mxfp4_min_warps, _compute_num_warps_sm120_mxfp4）: 核心修复 SM120 Blackwell 上 MXFP4 kernel 的 warp 不足问题，通过 monkey-patch 动态调整 compute_num_warps。
python/sglang/srt/layers/moe/topk.py（模块路由层；类别 source；类型 dependency-wiring；符号 routing）: 重写 routing 函数，适配新版 triton_kernels 的独立 topk 接口，替换已废弃的 routing 导入。
python/sglang/srt/layers/flashinfer_comm_fusion.py（模块通信融合；类别 source；类型 core-logic）: 修复 FlashInfer >=0.6.10 在 TP/EP/CP 子组中通信回退到 WORLD 导致挂起的问题，强制传递 group 参数。

关键符号：_patch_sm120_mxfp4_min_warps, _compute_num_warps_sm120_mxfp4, routing, is_triton_kernels_available

关键源码片段

`python/sglang/srt/layers/quantization/mxfp4.py`

核心修复 SM120 Blackwell 上 MXFP4 kernel 的 warp 不足问题，通过 monkey-patch 动态调整 compute_num_warps。

# 文件 : python/sglang/srt/layers/quantization/mxfp4.py
# 新增模块级标志，避免重复打补丁
_sm120_mxfp4_min_warps_patched = False

def _patch_sm120_mxfp4_min_warps():
    """为 SM120 Blackwell GPU 的 MXFP4 计算路径打补丁，
    确保当使用非持久化 StridedLayout 时 warp 数至少为 4。"""
    global _sm120_mxfp4_min_warps_patched
    if _sm120_mxfp4_min_warps_patched:
        return

    import inspect
    from triton_kernels.matmul_ogs_details.opt_flags_details import opt_flags_nvidia
    from triton_kernels.tensor import get_layout
    from triton_kernels.tensor_details.layout import StridedLayout

    # 引用原厂 compute_num_warps 函数
    compute_num_warps = opt_flags_nvidia.compute_num_warps
    params = inspect.signature(compute_num_warps).parameters

    # 仅当原始函数具有 is_persistent 参数且尚未打补丁时注入
    if "is_persistent" in params and not getattr(
        compute_num_warps, "_sglang_sm120_mxfp4_patch", False
    ):

        def _compute_num_warps_sm120_mxfp4(
            block_m, block_n, is_persistent, precision_config
        ):
            # 先调用原始函数获得默认 warp 数
            selected_num_warps = compute_num_warps(
                block_m, block_n, is_persistent, precision_config
            )
            # 检查是否使用了 StridedLayout 的 weight_scale
            weight_scale = getattr(precision_config, "weight_scale", None)
            weight_scale_layout = get_layout(weight_scale)
            if (
                not is_persistent
                and weight_scale is not None
                and (
                    weight_scale_layout is StridedLayout
                    or isinstance(weight_scale_layout, StridedLayout)
                )
            ):
                # SM120 非持久化路径需要至少 4 个 warp
                return max(selected_num_warps, 4)
            return selected_num_warps

        # 标记已打补丁，避免重复替换
        _compute_num_warps_sm120_mxfp4._sglang_sm120_mxfp4_patch = True
        opt_flags_nvidia.compute_num_warps = _compute_num_warps_sm120_mxfp4

    _sm120_mxfp4_min_warps_patched = True

# 在 _swizzle_mxfp4 函数中调用补丁注册
def _swizzle_mxfp4(quant_tensor, scale, num_warps):
    """weight swizzle for mxfp4 moe, used for OAI mxfp4 kernel"""
    import triton_kernels.matmul_ogs_details.opt_flags as opt_flags
    from triton_kernels.numerics import InFlexData
    from triton_kernels.tensor import FP4, convert_layout, wrap_torch_tensor
    from triton_kernels.tensor_details import layout

    if is_sm120_supported():
        _patch_sm120_mxfp4_min_warps() # 在 SM120 路径中确保补丁已应用
        from triton_kernels.tensor_details.layout import StridedLayout
        # ... 其余 StridedLayout 设置

`python/sglang/srt/layers/moe/topk.py`

重写 routing 函数，适配新版 triton_kernels 的独立 topk 接口，替换已废弃的 routing 导入。

# 文件 : python/sglang/srt/layers/moe/topk.py
# 在原有 try 块中重新定义 import 和 routing 函数
try:
    from triton_kernels.matmul_ogs import GatherIndx, RoutingData, ScatterIndx
    from triton_kernels.tensor import make_ragged_tensor_metadata
    from triton_kernels.topk import topk as triton_kernels_topk

    def routing(
        logits,
        n_expts_act,
        sm_first=False,
        expt_indx=None,
        simulated_ep=1,
        n_rows=None,
    ):
        """兼容 triton_kernels 3.6.0 的 routing 实现，使用独立的 topk 接口。"""
        if simulated_ep != 1:
            raise NotImplementedError(
                "simulated_ep routing is not supported with triton_kernels 3.6.0"
            )

        if sm_first:
            logits = torch.softmax(logits, dim=-1)

        sparse_logits = triton_kernels_topk(
            logits,
            n_expts_act,
            apply_softmax=not sm_first,
            y_indx=expt_indx,
            n_rows=n_rows,
        )
        dispatch_indx = sparse_logits.mask_metadata.row_sorted_indx
        combine_indx = sparse_logits.mask_metadata.col_sorted_indx
        ragged_metadata = make_ragged_tensor_metadata(
            sparse_logits.mask_metadata.col_sum, dispatch_indx.shape[0]
        )
        gate_scal = sparse_logits.vals.flatten()[combine_indx]
        routing_data = RoutingData(
            gate_scal,
            ragged_metadata.slice_sizes,
            logits.shape[-1],
            n_expts_act,
            ragged_metadata,
        )
        gather_indx = GatherIndx(combine_indx, dispatch_indx)
        scatter_indx = ScatterIndx(dispatch_indx, combine_indx)
        return routing_data, gather_indx, scatter_indx

except ImportError:
    pass

`python/sglang/srt/layers/flashinfer_comm_fusion.py`

修复 FlashInfer >=0.6.10 在 TP/EP/CP 子组中通信回退到 WORLD 导致挂起的问题，强制传递 group 参数。

# 文件 : python/sglang/srt/layers/flashinfer_comm_fusion.py
# 在 initialize 方法中创建 workspace 时传入 group 参数
kwargs = dict(
    backend="trtllm",
    world_size=world_size,
    rank=rank,
    max_token_num=max_token_num,
    hidden_dim=hidden_dim,
    dtype=dtype,
    force_oneshot_support=bool(use_oneshot),
    # Pin the symmetric-memory rendezvous to the actual subgroup.
    # Without this, flashinfer >=0.6.10 falls back to WORLD and
    # TP/EP/CP subgroup peers get addressed incorrectly (kernel hangs
    # in cuda-graph warmup).
    group=device_group,
)

# 在 ensure_workspace_initialized 中移除 tp_coordinator 比较逻辑
# 始终从 coordinator 获取实际组，确保子组通信正确
# 变更前：当子组等于全 TP 组时传 None，否则传 coordinator 的组
# 变更后：始终传递 coordinator.device_group 和 coordinator.cpu_group
# 这样 flashinfer 的对称内存 rendezvous 会使用正确的子组而非 WORLD
device_group = coordinator.device_group
cpu_group = coordinator.cpu_group

评论区精华

是否升级到 FlashInfer 0.6.11.post2 (question): 作者 Fridge003 认为当前 PR 先专注于 0.6.11.post1，升级到 post2 可另开 PR 处理。

风险与影响

风险：
1. 依赖兼容性：升级 flashinfer 为 0.6.11.post1 可能与旧版本不兼容，但 PR 已修改了所有使用点。若用户环境锁定旧 flashinfer，升级后需同步更新。
2. SM120 路径风险：_patch_sm120_mxfp4_min_warps 通过 monkey-patch 修改第三方库的 compute_num_warps，若 triton_kernels 版本更新可能失效。但补丁通过检查 is_persistent 参数存在性来安全启用，并设置了哨兵属性避免重复打补丁。
3. 分布式通信风险：强制传递 group 参数可能在不支持的 flashinfer 版本上失败，但 ensure_workspace_initialized 有异常捕获兜底，失败后会全局禁用 fusion。
4. 部分安装检测：is_triton_kernels_available 新增子模块检查，但若 triton_kernels 安装但子模块缺失（如旧版本），功能将自动降级，不会直接崩溃。
  - 影响：影响范围：涉及所有使用 MXFP4 量化（特别是 SM90/100/120 GPU）和 FlashInfer 通信融合的模型，如 DeepSeek、GPT OSS 等。用户需要更新 flashinfer 至 0.6.11.post1（pip install flashinfer-python>=0.6.11.post1）。分布式场景下（TP/EP/CP 子组）的通信融合正确性依赖本次修复。同时，之前因不兼容而跳过的 CI 测试（MXFP4 cutlass、DeepSeek V4 FP4 H200）恢复运行，表明这些功能恢复正常。
  - 风险标记：依赖升级, monkey-patch 第三方库, 分布式通信子组依赖, CI 测试恢复可能暴露新问题

关联脉络

PR #25312 之前基于的 PR（未在历史中，推测为升级 flashinfer 的前置尝试）: PR body 提到基于 #25312 修改，但未在给定历史列表中，可能为同系列工作的第一版。
PR #25310 revert flashinfer 0.6.11 bumps (#25310): 提交历史中包含 'Revert "revert flashinfer 0.6.11 bumps (#25310)"'，说明此前曾 revert 过升级，本 PR 恢复。
PR #25329 Skip CI tests added in #24816 (broken on main): 提交历史中包含 'Revert "Skip CI tests added in #24816 (broken on main) (#25329)"'，本 PR 恢复了被跳过的测试。

#25335 [Fix] Fix gpt oss triton kernels and upgrade flashinfer back to 0.6.11.post1

执行摘要

升级 FlashInfer 至 0.6.11.post1 并修复 GPT OSS Triton 内核适配问题

实现拆解

评论区精华

风险与影响

关联 Issue

未识别关联 Issue

完整报告

参与讨论