Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 12:34 同步状态:空闲 下次计划:2026-06-07 13:34

PR 列表

更多筛选
2026-05-20
功能 重要性 7.08 洞察度 6.00

Mooncake session 故障黑名单自动恢复

**值得精读**:该 PR 实现简洁而稳健,展示了如何在分布式系统中处理临时故障自动恢复的典型模式:守护线程 + 轻量探测 + 配置化。特别值得学习的是 `getattr` 回退策略,确保了与旧版 API 的兼容性。建议 reviewer 关注 mooncake 新版本的发布节奏,以便启用该功能。

#25750 fix(dsv4): make pool configurator PP-aware

原始 PR · 作者 whybeyoung · 合并时间 2026-05-20 10:58

缺陷修复 重要性 6.48 洞察度 5.00

修复 DSV4 PP 下内存池配置 over-counting

值得精读,可作为 Pipeline Parallelism 下按层分配资源的典型修复案例。改动虽小,但体现了对分布式系统中 rank 局部性理解的重要性,以及与 TokenToKVPool 保持一致的契约意识。

缺陷修复 重要性 5.44 洞察度 3.00

移除 V4 PD 与 PP 的冲突断言

值得快速合并,无争议的回归修复。可顺带关注:这是一个典型的“语义过期” bug——代码不做同步维护就变成 dead code 并引发误拦。团队未来可以在重构时及时标记或删除关联 guard,避免类似回退。

缺陷修复 重要性 6.39 洞察度 5.00

修复 Qwen layered 路径精度配置被忽略的问题

值得精读,展示了如何将配置精度从管线层传递到具体模型阶段。但对于想了解系统性精度处理的读者,建议同时查阅 issue #22295 和相关 PR。

缺陷修复 重要性 6.57 洞察度 4.00

修复 Hunyuan3D-2 DiT 模型 checkpoint 参数名映射

该 PR 值得精读,尤其是 `param_names_mapping` 的设计模式(正则替换 + merge_info)可复用于其他 DiT 或 Flux 系列模型。建议后续增加参数映射的单元测试,覆盖主要 checkpoint 变体。

#24641 [Intel GPU]Support fused_topk for XPU

原始 PR · 作者 gaopengff · 合并时间 2026-05-20 10:34

功能 重要性 6.12 洞察度 4.00

为 XPU 添加 fused_topk 支持

建议合入。PR 改动清晰、聚焦,审核通过。开发者在其他平台(NPU)已有类似实现的先例,XPU 的对应路径是合理的扩展。可考虑后续添加 XPU 端到端测试以确保正确性。

参与讨论