Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 17:58 同步状态:空闲 下次计划:2026-06-07 18:58

PR 列表

更多筛选
2026-03-26
功能 重要性 6.00 洞察度 5.00

在调度器中为gRPC预处理路径计算M-RoPE位置,修复多模态请求的缺失计算。

建议开发者和架构师精读此PR,关注如何在调度器中优雅地处理多模态处理器的加载和计算逻辑。特别值得学习的是错误降级机制和模块化设计,以确保系统健壮性。

#21246 [Fix] Try to fix nvcc compilation error

原始 PR · 作者 DarkSharpness · 合并时间 2026-03-26 10:59

缺陷修复 重要性 4.00 洞察度 3.00

修复 nvcc 编译错误并扩展多 GPU JIT 内核测试覆盖。

建议关注编译错误修复的细节,特别是 C++ 代码变更,以确保在其他编译器环境下无类似问题。同时,验证新增多 GPU 测试的正确性和效率。

#21260 Add adjusted_filter_batch

原始 PR · 作者 aurickq · 合并时间 2026-03-26 10:59

功能 重要性 4.00 洞察度 2.00

添加 adjusted_filter_batch 占位符方法扩展采样批处理自定义能力。

该 PR 变更简单,技术含量低,除非关注采样模块扩展,否则无需精读。

#21262 Fix customized_info offset truncation

原始 PR · 作者 aurickq · 合并时间 2026-03-26 10:57

缺陷修复 重要性 3.00 洞察度 2.00

修复 customized_info 在输出截断时的切片偏移错误,确保数据一致性。

该 PR 变更简单直接,工程师可快速浏览以了解切片修复逻辑,无需深度解析。对于管理者,关注点在于确保此 bugfix 被正确测试和部署。

缺陷修复 重要性 4.00 洞察度 3.00

修复 MxInt4 MoE 中 trtllm_mxint4_block_scale_moe 函数返回错误输出变量的问题。

该 PR 变更简单直接,适用于快速了解输出缓冲区处理的常见错误模式。对于涉及量化或 MoE 模块的开发者,值得关注以确保类似变量赋值问题被避免。

缺陷修复 重要性 5.00 洞察度 6.00

修复 CUDA wheel 打包中文件名与内部元数据不一致的问题,确保 pip 安装正常。

对于负责构建和打包的工程师,此 PR 值得精读,以了解如何正确处理 wheel 元数据对齐问题,关注点包括使用 wheel unpack/pack 的规范方法、错误处理和 robustness 改进。对于其他开发者,可以快速浏览以理解修复的动机和范围。

性能优化 重要性 6.00 洞察度 6.00

优化扩散模型Triton rotary embedding内核,通过一次处理多个注意力头提升性能。

建议开发人员精读此PR,关注内核重构的设计决策(如二维启动布局和多头掩码处理),并注意讨论中提到的autotune配置覆盖问题,考虑在后续PR中补充更大 `BLOCK_HS_HALF` 值以优化性能。

参与讨论