Prhub
← 返回仓库列表

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-04-19 08:14 同步状态:空闲 下次计划:2026-04-19 09:14

PR 列表

已合并 960 · 已分析 960
更多筛选
2026-04-13
功能 重要性 5.00 洞察度 4.00

为Intel GPU启用GPT-OSS bf16模型的融合专家MoE内核路径。

该PR值得快速浏览,重点关注:1. 跨平台内核参数传递的设计模式;2. Intel GPU支持扩展的演进方向。虽然变更简单,但体现了平台兼容性工作的典型模式。

#22633 [diffusion] refactor: streamline denoising stages

作者 mickqian · 合并时间 2026-04-13 13:34

重构 重要性 6.00 洞察度 5.00

重构扩散模型去噪阶段,引入 DenoisingContext 数据类,简化 LTX-2 特定逻辑。

建议精读 `denoising.py` 和 `ltx_2_denoising.py`,关注 `DenoisingContext` 设计、钩子架构以及序列并行方法的实现,这些是本次重构的核心设计决策,有助于理解扩散模型去噪流程的模块化演进。

#22187 [HiSparse]: Add benchmark for hisparse kernel

作者 hzh0425 · 合并时间 2026-04-13 12:49

测试 重要性 4.00 洞察度 4.00

为hisparse JIT内核添加基准测试脚本,评估缓存加载性能。

对于负责jit-kernel性能优化的工程师,建议浏览此PR以了解基准测试设计和配置参数;但对于一般开发者,无需深入阅读,因为核心代码未变。关注点可放在基准测试方法论和review中的改进建议上。

基础设施 重要性 6.00 洞察度 4.00

将CI默认CUDA版本从12.9升级到13.0,以匹配PyTorch 2.11默认。

对于技术管理者和工程师,建议快速浏览此PR以了解CUDA版本升级的CI配置变更,重点关注ci_install_dependency.sh中的wheel安装逻辑和测试计划执行情况,确保CI稳定后再推进Docker镜像更新。

#22505 Add bfloat16 KV cache validation for HiSparse

作者 mmangkad · 合并时间 2026-04-13 12:41

功能 重要性 4.00 洞察度 3.00

为HiSparse添加bfloat16 KV缓存验证,确保启用时数据类型正确。

该PR实现简单但关键,建议精读以理解HiSparse对KV缓存数据类型的依赖关系。关注设计决策:选择严格验证而非自动转换,体现了对数据类型一致性的重视。

#22631 [codex] Add LTX-2.3 benchmark skill recipes

作者 BBuf · 合并时间 2026-04-13 12:23

文档 重要性 4.00 洞察度 3.00

为LTX-2.3扩散模型添加一阶段和二阶段基准测试技能配方。

建议阅读此PR以了解扩散基准测试的技能设置,但需关注GPU数量设置的决策,可能反映了性能权衡或特定硬件假设。对于基准测试一致性,建议后续评估GPU配置优化。

参与讨论