Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 12:34 同步状态：空闲下次计划：2026-06-07 13:34

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-04-16

#22690 [diffusion] model: Properly validate device for Mistral 3 attention

原始 PR · 作者 avjves · 合并时间 2026-04-16 15:29

缺陷修复重要性 5.68 洞察度 4.00

修复 AMD ROCm 平台上 Mistral 3 注意力后端选择逻辑，避免误用 cuDNN 导致支持中断。

该 PR 值得精读，尤其是关注 `current_platform.is_cuda()` 与设备类型检查的结合使用，这是处理跨平台兼容性问题的典型设计决策。

diffusionbugfixrun-ci

#22870 [AMD][MoRI] bump MoRI to v1.1.0

原始 PR · 作者 jhchouuu · 合并时间 2026-04-16 15:11

基础设施重要性 3.69 洞察度 3.00

将 AMD ROCm Docker 镜像中的 MoRI 依赖从 v0.1.0 升级至 v1.1.0。

该 PR 变更直接且范围小，适合快速浏览以了解 AMD 支持栈的依赖更新。值得关注的设计决策是**从编译时配置转向运行时自动检测**，这体现了对部署灵活性的重视。建议结合 MoRI v1.1.0 的发布说明（PR body 中已链接）深入理解新特性。对于不直接使用 AMD ROCm 镜像的工程师，精读价值有限。

amdrun-ci

#22926 [misc] Configure logging before ServerArgs.__post_init__

原始 PR · 作者 merrymercy · 合并时间 2026-04-16 14:53

重构重要性 5.02 洞察度 3.00

在 ServerArgs 初始化前配置日志，确保日志时间戳格式正确。

该 PR 变更简单直接，适合快速浏览以了解日志初始化时机调整。值得关注的设计决策是使用 `force=True` 来确保日志配置在早期生效，避免因其他代码提前配置日志而导致格式不一致。

refactorrun-ciobservability

#20989 [Fix] eagle/eagle3 speculative decoding conflicts with xgrammar in NPU

原始 PR · 作者 ChefWu551 · 合并时间 2026-04-16 14:34

缺陷修复重要性 6.88 洞察度 6.00

修复NPU上推测解码与XGrammar冲突，确保语法掩码正确应用。

此PR值得精读，尤其是`xgrammar_backend.py`中设备分支的设计决策和`torch_ops/bitmask_ops.py`的回退实现，展示了如何在多硬件环境下优雅处理特定设备问题。关注review讨论中关于函数位置和命名的权衡，这对代码组织有借鉴意义。

bugfixnpuspeculative-decoding

#22758 [sgl] provide an option to send control req to all dp ranks rank0

原始 PR · 作者 bixue2010 · 合并时间 2026-04-16 14:24

性能优化重要性 6.55 洞察度 7.00

DP attention 控制消息广播优化

值得精读，展示了分布式系统中通过缩小同步范围减少 straggler 的典型优化思路。评审者在 PR 讨论中确认了不设为默认的权衡，可供参考。

performancerun-cischeduling

#22901 [Bug Fix] Remove follow_bootstrap_room fast path in PD disaggregation DP rank resolution

原始 PR · 作者 ByronHsu · 合并时间 2026-04-16 13:53

缺陷修复重要性 6.16 洞察度 7.00

修复PD解聚模式下follow_bootstrap_room负载均衡策略与外部路由指定DP rank冲突的bug。

该PR值得精读，特别是对于涉及PD解聚、数据并行和负载均衡策略的开发者。关注`CommonKVSender.__init__`中的冲突检测逻辑和`_resolve_prefill_dp_rank`中的条件调整，这些设计决策平衡了性能与正确性。同时，环境变量的引入展示了如何为复杂部署场景提供逃生舱口。

bugfixconsistencyrun-ci

#22923 docs: fix incorrect default max-payload-size in gateway config reference

原始 PR · 作者 Wen-xuan-Xu · 合并时间 2026-04-16 13:25

文档重要性 1.93 洞察度 1.00

修正网关配置文档中 max-payload-size 默认值从 256MB 改为 512MB。

该 PR 内容简单直接，仅涉及单行文档修正，无需深入精读。对于工程师，可关注其作为文档维护的范例：及时修正文档与代码的不一致，避免用户困惑。对于技术管理者，可将其视为低风险、高价值的文档维护案例。

documentationrun-ci

#22490 [EPD][VLM] Support Kimi VL EPD

原始 PR · 作者 LHXuuu · 合并时间 2026-04-16 12:40

功能重要性 8.76 洞察度 6.00

扩展 EPD 分解管道以支持 Kimi VL 多模态模型。

建议技术管理者和工程师精读此 PR，重点关注 `KimiGridMMDataMixin` 的设计如何优雅地提取共享逻辑，以及编码服务器中模型类型检查的扩展方式。这对于理解多模态 EPD 管道的演进和代码重构最佳实践有重要参考价值。

featuremultimodalconsistency

第 246 / 357 页 · 共 2850 条

上一页 1 … 244 245 246 247 248 … 357 下一页