# PR #22078 完整报告

- 仓库：`sgl-project/sglang`
- 标题：Revert "[Feature] JIT activation and update skills (by codex)"
- 合并时间：2026-04-04 06:04
- 原文链接：http://prhub.com.cn/sgl-project/sglang/pull/22078

---

# 执行摘要

- 一句话：回滚 JIT 激活功能，恢复 AOT 内核以解决 CI 测试失败。
- 推荐动作：建议技术管理者关注此回滚决策，评估 CI 失败的根本原因，以决定是否未来重新引入 JIT 激活。工程师可精读修改的文件（如 `python/sglang/srt/layers/activation.py` 和 MoE 相关文件），了解回滚对性能敏感路径的影响，并监控后续性能测试结果。

# 功能与动机

根据 PR body，回滚是因为 PR #21766 导致了一个 CI 测试失败（链接：https://github.com/sgl-project/sglang/actions/runs/23958698449/job/69895069178?pr=21913），目的是恢复系统稳定性和避免潜在错误。

# 实现拆解

实现为完整回滚 PR #21766 的变更：删除了 JIT 激活相关文件（如 `python/sglang/jit_kernel/activation.py`、`python/sglang/jit_kernel/csrc/elementwise/activation.cuh`、测试文件 `test_activation.py` 和基准文件 `bench_activation.py`），并修改了多个使用激活函数的文件（如 `python/sglang/srt/layers/activation.py`、`python/sglang/srt/layers/moe/cutlass_moe.py` 等），将导入从 `sglang.jit_kernel.activation` 替换为 `sgl_kernel` 以恢复 AOT 实现。

关键文件：
- `python/sglang/jit_kernel/activation.py`（模块 jit-kernel）: 删除 JIT 激活的核心 Python 包装器模块，包含 `silu_and_mul` 等函数定义。
- `python/sglang/jit_kernel/csrc/elementwise/activation.cuh`（模块 jit-kernel）: 删除 JIT 激活的 CUDA 内核实现，涉及 PDL 支持和向量化优化。
- `python/sglang/srt/layers/activation.py`（模块 srt-layers）: 修改激活层导入逻辑，从 JIT 回滚至 AOT 内核，影响所有 CUDA/XPU 平台的激活函数调用。
- `python/sglang/srt/layers/moe/cutlass_moe.py`（模块 moe）: 修改 MoE 层导入，替换 `silu_and_mul` 的 JIT 版本为 AOT 版本，影响专家激活路径。
- `.claude/skills/add-jit-kernel/SKILL.md`（模块 documentation）: 修改技能文档，移除 JIT 激活的相关示例和注释，反映回滚后的代码状态。

关键符号：silu_and_mul, gelu_and_mul, gelu_tanh_and_mul


# 评论区精华

无 review 评论，PR 直接合并，未进行技术讨论。

- 暂无高价值评论线程

# 风险与影响

- 风险：技术风险包括：1) 性能回退风险：JIT 激活可能提供了优化（如 PDL 支持和向量化），回滚后可能影响推理速度，特别是在高并发场景；2) 回归风险：恢复 AOT 内核可能重新引入原问题或兼容性问题，例如在特定硬件（如 SM100+）上的行为差异；3) 测试覆盖减少：删除了 JIT 激活的专用测试文件，可能降低对激活函数正确性的验证覆盖；4) 代码一致性：回滚后，多个文件中的导入逻辑变得不一致（如 CUDA 和 HIP 平台处理），可能增加维护复杂度。
- 影响：影响范围广泛：激活函数在多个核心模块中使用，包括混合专家（MoE）层、量化层（如 GGUF）、LoRA 和扩散模型，直接影响模型推理路径。用户可能观察到性能变化（如速度下降），但系统稳定性得到修复。对开发团队，回滚简化了代码库，但可能延迟 JIT 特性的集成和性能优化路线图。
- 风险标记：CI 失败修复 , 性能回退风险 , 跨模块影响

# 关联脉络

- PR #21766 [Feature] JIT activation and update skills (by codex): 本 PR 回滚的原始 PR，引入了 JIT 激活功能，导致 CI 失败。
- PR #22046 Revert "[Kernel] Fuse temperature + softmax in sampling for decode speedup": 类似回滚模式，涉及内核变更和性能优化撤销。
- PR #22047 Revert "[Feature] NVFP4 Marlin fallback for non-Blackwell GPUs (SM75+…": 类似回滚模式，涉及量化功能撤销和 CI 稳定性修复。