Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 11:28 同步状态:空闲 下次计划:2026-06-07 12:28

PR 列表

更多筛选
2026-04-13
重构 重要性 3.00 洞察度 2.00

简化测试日志捕获,移除临时文件改用继承stdout/stderr。

该PR变更简单直接,适合快速浏览以了解测试基础设施的改进。值得关注的点是移除了对特定错误信息的断言检查,团队需评估这是否会降低测试的健壮性。对于涉及流式会话和内存泄漏测试的开发者,建议了解日志捕获方式的变更。

基础设施 重要性 3.00 洞察度 2.00

移除AMD ROCm Dockerfile中已由上游aiter v0.1.12.post1修复的临时补丁。

该PR值得快速浏览以了解依赖清理过程,但无需深入分析代码逻辑。关注点在于如何通过上游依赖升级来简化本地补丁,这是基础设施维护的常见模式。

功能 重要性 5.00 洞察度 4.00

为Intel GPU启用GPT-OSS bf16模型的融合专家MoE内核路径。

该PR值得快速浏览,重点关注:1. 跨平台内核参数传递的设计模式;2. Intel GPU支持扩展的演进方向。虽然变更简单,但体现了平台兼容性工作的典型模式。

重构 重要性 6.00 洞察度 5.00

重构扩散模型去噪阶段,引入 DenoisingContext 数据类,简化 LTX-2 特定逻辑。

建议精读 `denoising.py` 和 `ltx_2_denoising.py`,关注 `DenoisingContext` 设计、钩子架构以及序列并行方法的实现,这些是本次重构的核心设计决策,有助于理解扩散模型去噪流程的模块化演进。

基础设施 重要性 3.70 洞察度 3.00

升级 Intel GPU 平台 PyTorch 依赖至 2.11 版本,同步更新 Docker 和文档。

该 PR 是常规依赖升级,值得关注以确保测试覆盖和向后兼容性;工程师应检查相关模块是否有 API 变化需要适配。

测试 重要性 3.00 洞察度 2.00

为 hisparse JIT 内核添加 CI 测试套件,验证 kvcache-swap-in 功能。

建议快速浏览此 PR,了解 hisparse 内核的测试方法和场景设计。对于关注 JIT 内核或 CI 测试的工程师,可以关注测试用例的编写方式。

#22187 [HiSparse]: Add benchmark for hisparse kernel

原始 PR · 作者 hzh0425 · 合并时间 2026-04-13 12:49

测试 重要性 4.00 洞察度 4.00

为hisparse JIT内核添加基准测试脚本,评估缓存加载性能。

对于负责jit-kernel性能优化的工程师,建议浏览此PR以了解基准测试设计和配置参数;但对于一般开发者,无需深入阅读,因为核心代码未变。关注点可放在基准测试方法论和review中的改进建议上。

基础设施 重要性 6.00 洞察度 4.00

将CI默认CUDA版本从12.9升级到13.0,以匹配PyTorch 2.11默认。

对于技术管理者和工程师,建议快速浏览此PR以了解CUDA版本升级的CI配置变更,重点关注ci_install_dependency.sh中的wheel安装逻辑和测试计划执行情况,确保CI稳定后再推进Docker镜像更新。

参与讨论