Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 12:34 同步状态：空闲下次计划：2026-06-07 13:34

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-05-20

#25287 [PD] Un-blacklist mooncake sessions when probe succeeds

原始 PR · 作者 kflansburg · 合并时间 2026-05-20 11:16

功能重要性 7.08 洞察度 6.00

Mooncake session 故障黑名单自动恢复

**值得精读**：该 PR 实现简洁而稳健，展示了如何在分布式系统中处理临时故障自动恢复的典型模式：守护线程 + 轻量探测 + 配置化。特别值得学习的是 `getattr` 回退策略，确保了与旧版 API 的兼容性。建议 reviewer 关注 mooncake 新版本的发布节奏，以便启用该功能。

schedulinginfrakv-cache

#24231 [Bug][VLM] Fix shared memory bug: deep copy mm_items to prevent cross…

原始 PR · 作者 mingyue300 · 合并时间 2026-05-20 11:06

缺陷修复重要性 6.22 洞察度 4.00

修复 VLM 共享内存跨请求突变 bug

值得合并的紧急 bugfix。建议后续将深拷贝逻辑抽取为 `_deep_copy_mm_items` 方法以改善可维护性。

bugfixmultimodalfeature

#25750 fix(dsv4): make pool configurator PP-aware

原始 PR · 作者 whybeyoung · 合并时间 2026-05-20 10:58

缺陷修复重要性 6.48 洞察度 5.00

修复 DSV4 PP 下内存池配置 over-counting

值得精读，可作为 Pipeline Parallelism 下按层分配资源的典型修复案例。改动虽小，但体现了对分布式系统中 rank 局部性理解的重要性，以及与 TokenToKVPool 保持一致的契约意识。

bugfixdeepseekperformance

#25771 fix(dsv4): drop stale pp_size=1 guard for V4 PD disaggregation

原始 PR · 作者 whybeyoung · 合并时间 2026-05-20 10:57

缺陷修复重要性 5.44 洞察度 3.00

移除 V4 PD 与 PP 的冲突断言

值得快速合并，无争议的回归修复。可顺带关注：这是一个典型的“语义过期” bug——代码不做同步维护就变成 dead code 并引发误拦。团队未来可以在重构时及时标记或删除关联 guard，避免类似回退。

deepseekbugfixscheduling

#22289 [Bugfix] multimodal_gen(hunyuan3d): honor config precisions for delight/paint

原始 PR · 作者 jy-song-hub · 合并时间 2026-05-20 10:38

缺陷修复重要性 6.66 洞察度 4.00

修复 Hunyuan3D 精度配置和负提示词

值得精读，尤其是理解如何在现有代码中通过 `PRECISION_TO_TYPE` 和简单回退逻辑实现精度配置的兼容性修复。对于类似的多模态生成模块有参考价值。

bugfixdiffusionmultimodal

#21980 [BugFix] Respect configured precision in Qwen layered path

原始 PR · 作者 jy-song-hub · 合并时间 2026-05-20 10:38

缺陷修复重要性 6.39 洞察度 5.00

修复 Qwen layered 路径精度配置被忽略的问题

值得精读，展示了如何将配置精度从管线层传递到具体模型阶段。但对于想了解系统性精度处理的读者，建议同时查阅 issue #22295 和相关 PR。

bugfixdiffusionmultimodal

#22729 [Bugfix] Fix Hunyuan3D-2 DiT checkpoint param mapping

原始 PR · 作者 jy-song-hub · 合并时间 2026-05-20 10:37

缺陷修复重要性 6.57 洞察度 4.00

修复 Hunyuan3D-2 DiT 模型 checkpoint 参数名映射

该 PR 值得精读，尤其是 `param_names_mapping` 的设计模式（正则替换 + merge_info）可复用于其他 DiT 或 Flux 系列模型。建议后续增加参数映射的单元测试，覆盖主要 checkpoint 变体。

bugfixdiffusionmultimodal

#24641 [Intel GPU]Support fused_topk for XPU

原始 PR · 作者 gaopengff · 合并时间 2026-05-20 10:34

功能重要性 6.12 洞察度 4.00

为 XPU 添加 fused_topk 支持

建议合入。PR 改动清晰、聚焦，审核通过。开发者在其他平台（NPU）已有类似实现的先例，XPU 的对应路径是合理的扩展。可考虑后续添加 XPU 端到端测试以确保正确性。

xpufeatureperformance

第 96 / 357 页 · 共 2850 条

上一页 1 … 94 95 96 97 98 … 357 下一页

sgl-project/sglang

PR 列表

#25287 [PD] Un-blacklist mooncake sessions when probe succeeds

#24231 [Bug][VLM] Fix shared memory bug: deep copy mm_items to prevent cross…

#25750 fix(dsv4): make pool configurator PP-aware

#25771 fix(dsv4): drop stale pp_size=1 guard for V4 PD disaggregation

#22289 [Bugfix] multimodal_gen(hunyuan3d): honor config precisions for delight/paint

#21980 [BugFix] Respect configured precision in Qwen layered path

#22729 [Bugfix] Fix Hunyuan3D-2 DiT checkpoint param mapping

#24641 [Intel GPU]Support fused_topk for XPU

参与讨论