执行摘要

线性注意力后端枚举扩展自定义插件支持

PR body 明确指出：增加 CUSTOM 成员和 missing 回退，使得插件注册的后端名称能够解析为 CUSTOM 而非抛出 ValueError，从而允许下游包通过 add_linear_attn_kernel_backend_choices 注册自定义线性注意力内核后端，无需修改枚举本身。

值得精读。该 PR 展示了如何通过 Python 枚举的 _missing_ 机制实现安全的插件式扩展，是一种简洁且不破坏现有 API 的设计模式。可作为 sglang 内部其他枚举扩展的参考。

讨论亮点

该 PR 没有 review 评论。唯一的审核来自 merrymercy 的 APPROVED，无额外讨论。合并前通过 /tag-and-rerun-ci 触发了 CI。

实现拆解

枚举扩展 CUSTOM 成员：在 python/sglang/srt/layers/attention/linear/utils.py 的 LinearAttnKernelBackend 枚举中新增 CUSTOM = "custom" 成员，并添加 _missing_ 类方法，当枚举构造时遇到未定义的值时返回 cls.CUSTOM，避免 ValueError。同时新增 is_custom() 实例方法用于后续判断。
日志调整：在 initialize_linear_attn_config 函数中，将原本记录 LINEAR_ATTN_DECAY_BACKEND.value 改为直接记录 decode 和 prefill 参数变量，因为自定义后端时 .value 可能恒为 "custom" 而丢失原始传入的插件名称信息。
新增插件注册函数：在 python/sglang/srt/server_args.py 中新增 add_linear_attn_kernel_backend_choices 函数，遵循项目中已有的其他 backend choice 扩展模式（如 add_grammar_backend_choices），用于向 LINEAR_ATTN_KERNEL_BACKEND_CHOICES 列表追加选项。
无测试、文档或配置配套改动：PR 明确标注未添加单元测试，也无文档更新，属于最小可行改动。

文件	模块	状态	重要度
`python/sglang/srt/layers/attention/linear/utils.py`	线性注意力	modified	6.74
`python/sglang/srt/server_args.py`	服务器参数	modified	5.49

关键符号

_missing_ is_custom add_linear_attn_kernel_backend_choices

关键源码片段

python/sglang/srt/layers/attention/linear/utils.py core-logic

核心文件，修改了 LinearAttnKernelBackend 枚举，新增 CUSTOM 成员和 _missing_ 回退机制，以及 is_custom 方法。

# python/sglang/srt/layers/attention/linear/utils.py

class LinearAttnKernelBackend(Enum):
    TRITON = "triton"
    CUTEDSL = "cutedsl"
    FLASHINFER = "flashinfer"
    CUSTOM = "custom" # 新增：用于标识外部插件注册的自定义后端

    @classmethod
    def _missing_(cls, value):
        # 当 enum 构造时遇到未定义的字符串值，不抛 ValueError，
        # 而是返回 CUSTOM，从而允许下游插件注册任意名称
        return cls.CUSTOM

    # 省略 is_triton, is_cutedsl, is_flashinfer ...

    def is_custom(self):
        return self == LinearAttnKernelBackend.CUSTOM

# ...
def initialize_linear_attn_config(server_args: ServerArgs):
    # ...
    decode = server_args.linear_attn_decode_backend or base
    prefill = server_args.linear_attn_prefill_backend or base
    # 注意：这里改用 decode/prefill 变量直接记录原始字符串，
    # 而不是枚举的 .value，因为自定义后端时 .value 恒为 "custom"
    LINEAR_ATTN_DECODE_BACKEND = LinearAttnKernelBackend(decode)
    LINEAR_ATTN_PREFILL_BACKEND = LinearAttnKernelBackend(prefill)
    rank0_log(f"Linear attention kernel backend: decode={decode}, prefill={prefill}")

python/sglang/srt/server_args.py core-logic

新增 add_linear_attn_kernel_backend_choices 函数，提供与已有其他 backend 一致的插件注册入口。

# python/sglang/srt/server_args.py

# 在 add_rl_on_policy_target_choices 之后，添加如下函数：
def add_linear_attn_kernel_backend_choices(choices):
    # 接受一个列表参数，将其追加到全局的 LINEAR_ATTN_KERNEL_BACKEND_CHOICES
    # 供下游插件在服务启动前注册自定义后端名称
    LINEAR_ATTN_KERNEL_BACKEND_CHOICES.extend(choices)

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论，后续有更多讨论时会体现在这里。

风险与影响

低风险。变更仅涉及枚举回退和日志记录参数调整，不影响现有三个后端（TRITON, CUTEDSL, FLASHINFER）的正常使用。风险点包括：

1) 若下游插件使用了一个与内置成员重名的字符串，会优先匹配内置成员而非 CUSTOM，但这是预期行为；
2) initialize_linear_attn_config 的日志不再输出 CUSTOM 的枚举值，而是输出原始字符串，对调试有一定好处。整体风险可控。

影响范围小，仅涉及线性注意力后端的枚举解析和插件注册入口。对用户无直接行为变化，对系统无性能或安全影响。对团队而言，统一了后端扩展 API 的风格，降低了后续添加自定义后端的门槛。

缺少测试覆盖

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接，后续同步到相关引用后会出现在这里。

完整报告

执行摘要

一句话：线性注意力后端枚举扩展自定义插件支持
推荐动作：值得精读。该 PR 展示了如何通过 Python 枚举的 _missing_ 机制实现安全的插件式扩展，是一种简洁且不破坏现有 API 的设计模式。可作为 sglang 内部其他枚举扩展的参考。

功能与动机

实现拆解

枚举扩展 CUSTOM 成员：在 python/sglang/srt/layers/attention/linear/utils.py 的 LinearAttnKernelBackend 枚举中新增 CUSTOM = "custom" 成员，并添加 _missing_ 类方法，当枚举构造时遇到未定义的值时返回 cls.CUSTOM，避免 ValueError。同时新增 is_custom() 实例方法用于后续判断。
日志调整：在 initialize_linear_attn_config 函数中，将原本记录 LINEAR_ATTN_DECAY_BACKEND.value 改为直接记录 decode 和 prefill 参数变量，因为自定义后端时 .value 可能恒为 "custom" 而丢失原始传入的插件名称信息。
新增插件注册函数：在 python/sglang/srt/server_args.py 中新增 add_linear_attn_kernel_backend_choices 函数，遵循项目中已有的其他 backend choice 扩展模式（如 add_grammar_backend_choices），用于向 LINEAR_ATTN_KERNEL_BACKEND_CHOICES 列表追加选项。
无测试、文档或配置配套改动：PR 明确标注未添加单元测试，也无文档更新，属于最小可行改动。

关键文件：

python/sglang/srt/layers/attention/linear/utils.py（模块线性注意力；类别 source；类型 core-logic；符号 missing, is_custom）: 核心文件，修改了 LinearAttnKernelBackend 枚举，新增 CUSTOM 成员和 missing 回退机制，以及 is_custom 方法。
python/sglang/srt/server_args.py（模块服务器参数；类别 source；类型 core-logic；符号 add_linear_attn_kernel_backend_choices）: 新增 add_linear_attn_kernel_backend_choices 函数，提供与已有其他 backend 一致的插件注册入口。

关键符号：missing, is_custom, add_linear_attn_kernel_backend_choices

关键源码片段

`python/sglang/srt/layers/attention/linear/utils.py`

核心文件，修改了 LinearAttnKernelBackend 枚举，新增 CUSTOM 成员和 missing 回退机制，以及 is_custom 方法。

# python/sglang/srt/layers/attention/linear/utils.py

class LinearAttnKernelBackend(Enum):
    TRITON = "triton"
    CUTEDSL = "cutedsl"
    FLASHINFER = "flashinfer"
    CUSTOM = "custom" # 新增：用于标识外部插件注册的自定义后端

    @classmethod
    def _missing_(cls, value):
        # 当 enum 构造时遇到未定义的字符串值，不抛 ValueError，
        # 而是返回 CUSTOM，从而允许下游插件注册任意名称
        return cls.CUSTOM

    # 省略 is_triton, is_cutedsl, is_flashinfer ...

    def is_custom(self):
        return self == LinearAttnKernelBackend.CUSTOM

# ...
def initialize_linear_attn_config(server_args: ServerArgs):
    # ...
    decode = server_args.linear_attn_decode_backend or base
    prefill = server_args.linear_attn_prefill_backend or base
    # 注意：这里改用 decode/prefill 变量直接记录原始字符串，
    # 而不是枚举的 .value，因为自定义后端时 .value 恒为 "custom"
    LINEAR_ATTN_DECODE_BACKEND = LinearAttnKernelBackend(decode)
    LINEAR_ATTN_PREFILL_BACKEND = LinearAttnKernelBackend(prefill)
    rank0_log(f"Linear attention kernel backend: decode={decode}, prefill={prefill}")

`python/sglang/srt/server_args.py`

新增 add_linear_attn_kernel_backend_choices 函数，提供与已有其他 backend 一致的插件注册入口。

# python/sglang/srt/server_args.py

# 在 add_rl_on_policy_target_choices 之后，添加如下函数：
def add_linear_attn_kernel_backend_choices(choices):
    # 接受一个列表参数，将其追加到全局的 LINEAR_ATTN_KERNEL_BACKEND_CHOICES
    # 供下游插件在服务启动前注册自定义后端名称
    LINEAR_ATTN_KERNEL_BACKEND_CHOICES.extend(choices)

评论区精华

该 PR 没有 review 评论。唯一的审核来自 merrymercy 的 APPROVED，无额外讨论。合并前通过 /tag-and-rerun-ci 触发了 CI。

暂无高价值评论线程

风险与影响

风险：低风险。变更仅涉及枚举回退和日志记录参数调整，不影响现有三个后端（TRITON, CUTEDSL, FLASHINFER）的正常使用。风险点包括：
1) 若下游插件使用了一个与内置成员重名的字符串，会优先匹配内置成员而非 CUSTOM，但这是预期行为；
2) initialize_linear_attn_config 的日志不再输出 CUSTOM 的枚举值，而是输出原始字符串，对调试有一定好处。整体风险可控。
- 影响：影响范围小，仅涉及线性注意力后端的枚举解析和插件注册入口。对用户无直接行为变化，对系统无性能或安全影响。对团队而言，统一了后端扩展 API 的风格，降低了后续添加自定义后端的门槛。
- 风险标记：缺少测试覆盖

关联脉络

暂无明显关联 PR

#24937 [Linear Attn] Add CUSTOM enum and plugin extensibility for kernel backends

执行摘要

线性注意力后端枚举扩展自定义插件支持

实现拆解

评论区精华

没有提炼出高价值讨论线程

风险与影响

关联 Issue

未识别关联 Issue

完整报告

执行摘要

功能与动机

实现拆解

关键源码片段

`python/sglang/srt/layers/attention/linear/utils.py`

`python/sglang/srt/server_args.py`

评论区精华

风险与影响

关联脉络

参与讨论