Prhub

#23733 chore: bump sglang-kernel version to 0.4.1.post1

原始 PR 作者 sglang-bot 合并时间 2026-04-26 14:23 文件变更 10 提交数 2 评论 1 代码增减 +6 / -24

执行摘要

升级 sglang-kernel 至 0.4.1.post1 并恢复 hiCache 测试

根据 PR body,对 sglang-kernel 的版本要求需与 sgl-kernel/pyproject.toml 中定义的一致。此外,在 PR #23119 中由于 CUDA 13 升级导致部分 hiCache 测试出现段错误(cudaMemcpyBatchAsync segfault),这些测试被临时移至 manual 目录。新版本 0.4.1.post1 已修复该问题,因此可重新激活这些测试。

建议快速浏览,重点关注测试恢复时的 CI 注册套件选择。版本升级模式可作为后续依赖同步的参考。

讨论亮点

本 PR 仅有一条来自 gemini-code-assist[bot] 的自动评论,确认变更一致正确,无实质性讨论。Kangyan-Zhou 在合并前于 Issue 中评论 /tag-and-rerun-ci 以触发 CI 重跑。

实现拆解

  1. 版本号更新:在 python/sglang/srt/entrypoints/engine.py 中的版本断言、python/pyproject.toml 的依赖声明、docker/Dockerfile 的构建参数中将 0.4.1 改为 0.4.1.post1

  2. 测试文件恢复:将 7 个测试文件从 test/manual/ 迁移到 test/registered/ 下的对应子目录,并删除文件头部的多行 TODO 注释(内容关于 cu13 升导致的段错误)。

  3. CI 注册增强:对于 test/registered/hicache/test_hicache_storage_mooncake_backend.py,额外添加了 register_cuda_ci(est_time=236, suite="stage-b-test-2-gpu-large") 调用,将其注册到指定的 CI 套件;其余测试文件仅做路径移动和注释清理,保留了原有的 CI 注册语句。

文件 模块 状态 重要度
python/sglang/srt/entrypoints/engine.py 引擎核心 modified 5.33
python/pyproject.toml 项目配置 modified 3.87
docker/Dockerfile 容器构建 modified 2.78
test/registered/hicache/test_hicache_storage_mooncake_backend.py Mooncake 测试 renamed 4.92
test/registered/4-gpu-models/test_qwen35_hicache.py Qwen3.5 测试 renamed 4.91
test/registered/hicache/test_hicache_storage.py 存储测试 renamed 4.3
test/registered/hicache/test_hicache_storage_3fs_backend.py 3FS 测试 renamed 3.66
test/registered/hicache/test_hicache_storage_file_backend.py 文件存储测试 renamed 3.66
test/registered/hicache/test_hicache_storage_runtime_attach_detach.py 运行时测试 renamed 3.66
test/registered/hicache/test_hicache_variants.py 变体测试 renamed 3.66

关键源码片段

python/sglang/srt/entrypoints/engine.py core-logic

核心版本断言所在,确保运行时 sglang-kernel 版本符合要求。

# 位于 _set_envs_and_config() 函数中
if _is_cuda:
    assert_pkg_version(
        "sglang-kernel",
        "0.4.1.post1", # 从 0.4.1 升至 0.4.1.post1,对齐 sgl-kernel 版本
        "Please reinstall the latest version with `pip install sglang-kernel --force-reinstall`",
    )

评论区精华

版本号变更验证 other

gemini-code-assist[bot] 自动评论:变更一致正确,无反馈。

结论:无问题 · 已解决

风险与影响

风险较低。版本号提升可能导致旧版本残留,但 CI 依赖安装会覆盖。测试恢复可能因 CI 环境差异偶发失败,但测试已在 manual 模式验证。主要风险是 CUDA 13 兼容性修复是否完整,但测试覆盖增加了信心。

对用户无直接影响,但后续安装 sglang-kernel 时会拉取 0.4.1.post1 版本。对开发/测试团队:hiCache 测试重新加入 CI,增强了回归覆盖,简化了测试维护(不再需要手动管理禁用状态)。

版本兼容性风险(低) 测试覆盖恢复

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论