Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 10:11 同步状态:空闲 下次计划:2026-06-07 11:11
后台正在同步并分析最近 PR,页面会自动刷新并逐步显示最新结果。

PR 列表

更多筛选
2026-05-29

#26704 pin kernels<0.15

原始 PR · 作者 hnyls2002 · 合并时间 2026-05-29 16:46

缺陷修复 重要性 3.63 洞察度 2.00

限制 kernels 依赖版本 <0.15

此 PR 是必要的紧急修复,暂不涉及架构性设计。值得在后续版本中关注上游修复进展,并及时移除版本锁定。

缺陷修复 重要性 8.14 洞察度 6.00

修复 IB 设备 JSON 映射验证回归

该 PR 属于重要的 bugfix + 小重构,建议阅读以了解 IB 设备配置的设计模式和验证流程。尤其关注 `parse_ib_device_config` 的提取和内部函数 `_normalize_device_group` 的复用方式,对类似配置解析场景有参考价值。

性能优化 重要性 6.60 洞察度 7.00

消除 MLA 注意力 MXFP4 路径冗余拷贝

建议合入。该 PR 是一个典型的零开销布局优化范例,通过改变分配顺序消除隐式拷贝,代码改动量小、收益明确、风险低。值得关注的是其利用 aiter 内核 stride 参数支持非连续输出的特性,可在类似场景复用。

#26698 fix stage-b-test-2-npu-a2 image

原始 PR · 作者 monkeyLoveding · 合并时间 2026-05-29 16:09

缺陷修复 重要性 2.95 洞察度 1.00

修复 NPU CI 配置中变量引用错误

值得合并,属于紧急 CI 修复。可关注后续是否有更多类似变量引用错误。

#16775 [CPU] Add GPT-OSS model optimization for CPU

原始 PR · 作者 blzheng · 合并时间 2026-05-29 16:05

功能 重要性 8.41 洞察度 5.00

为CPU添加GPT-OSS模型优化支持

值得精读,尤其是MoE kernel中bias和swiglu融合的设计方式、flash_attn逐行处理以支持sliding window的取舍,以及测试重构(@parametrize)模式。建议关注MXFP4路径的后续性能基准测试。

参与讨论