Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 12:34 同步状态：空闲下次计划：2026-06-07 13:34

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-05-19

#24954 [Mamba] Fix extra_buffer overlap schedule races

原始 PR · 作者 hanming-lu · 合并时间 2026-05-19 12:13

缺陷修复重要性 8.45 洞察度 6.00

将 Mamba 状态操作迁移到 forward stream 消除调度竞争

该 PR 值得所有关注并发调度和 Mamba 模型的开发者精读，其“捐赠模式”和“延迟操作到 forward stream”是处理调度器与前向流之间竞争的有效模式。建议合并后关注 HiCache 兼容性修复和 review 中提到的 GPU→CPU 同步优化。

mambabugfixscheduling

#25588 perf(mimo-v2-epd): enable GPU image preprocess and parallel video decode

原始 PR · 作者 Abatom · 合并时间 2026-05-19 11:47

性能优化重要性 7.12 洞察度 5.00

MIMO-v2 EPD: GPU 图像预处理与并行视频解码

值得精读，尤其是线程数调优的 benchmark 数据和权衡过程。设计上配置灵活、默认上限保守，对类似优化有参考意义。建议补充分支测试并考虑将 import torch 移到模块顶层。

performancefeaturemultimodal

#25570 Use triton_attn as default vision attention on B300 (SM103)

原始 PR · 作者 yhyang201 · 合并时间 2026-05-19 11:00

功能重要性 4.88 洞察度 2.00

B300 默认视觉注意力回退为 triton_attn

此 PR 改动简单直接，适合快速合入以确保 B300 上的多模态功能可用。建议关注后续 FA4 在 B300 上的验证进度，验证通过后恢复 fa4 默认值。

multimodalfeatureperformance

#24611 [Codex] Opt Mistral Large performace

原始 PR · 作者 BBuf · 合并时间 2026-05-19 10:59

性能优化重要性 5.99 洞察度 4.00

为 Mistral Large 3 启用 FlashInfer AllReduce 融合并新增 FP8 MoE 配置

对于部署 Mistral Large 3 或类似高 MoE 模型的团队，建议合并并验证。该 PR 展示了为特定模型添加性能优化支持的典型模式：模型架构识别、自动启用特性、以及提供预调优内核配置。值得关注的是其包装器架构处理逻辑，可作为后续支持多模态模型的参考。

performancefeaturemoe

#25596 [diffusion] fix LTX2 resident defaults and stage profiling

原始 PR · 作者 mickqian · 合并时间 2026-05-19 10:41

缺陷修复重要性 8.10 洞察度 5.00

修复LTX2 resident默认卸载与stage profiling名称冲突

建议熟读base.py中注册名称与profile名称的设计，以及composed_pipeline_base中的去重逻辑，这是pipeline stage命名的重要设计决策。同时建议后续修复H200兼容性缺失。

diffusionbugfixfeature

#25699 [Bug][PD][NIXL] always send aux on is_last; only expects_state when truthy

原始 PR · 作者 ishandhanani · 合并时间 2026-05-19 10:04

缺陷修复重要性 6.63 洞察度 5.00

修复 NIXL 密集模型 disagg 挂起问题

建议立即合入，并发布补丁版本 v0.5.13。值得关注的是分离推理中状态传输的条件设计，未来类似重构应确保密集模型路径的回归测试。

bugfixinfradeepseek

#25282 [UnifiedTree] Support deepseek v4 host pool layout

原始 PR · 作者 huangtingwei9988 · 合并时间 2026-05-19 09:36

功能重要性 7.50 洞察度 5.00

支持 DeepSeek V4 主机池多布局

建议深入了解该 PR 的设计选择，特别是布局与 io 后端的组合对性能的影响，可为后续其他模型的内存层次优化提供参考。

hicachedeepseekfeature

#25689 Add spec_verify_calls_total metric for speculative decoding

原始 PR · 作者 merrymercy · 合并时间 2026-05-19 09:35

功能重要性 5.52 洞察度 4.00

新增 spec_verify_calls_total 指标

值得精读，展示如何为系统增加可观测性指标，可参考此模式添加其他监控。

observabilityspeculative-decodingfeature

第 101 / 357 页 · 共 2850 条

上一页 1 … 99 100 101 102 103 … 357 下一页