Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 10:11 同步状态:空闲 下次计划:2026-06-07 11:11
后台正在同步并分析最近 PR,页面会自动刷新并逐步显示最新结果。

PR 列表

更多筛选
2026-05-06
功能 重要性 6.62 洞察度 5.00

HiSparse 支持 FP8 KV cache 后端路由

该 PR 是一个小而优雅的改进,通过简单的路由逻辑扩展了 HiSparse 的功能。值得精读的部分是 `_set_default_nsa_backends` 中条件判断的设计思路,以及 `check_server_args` 中 dtype 与后端配对校验的灵活性。建议合入。

功能 重要性 6.97 洞察度 6.00

DeepEP 支持 routed experts 捕获与 all-gather

值得精读,尤其是 `capture` 和 `_get_local_slice` 的设计权衡,以及测试如何构造有效覆盖。对从事分布式 MoE 和 RL 捕获的同学有参考价值。

#24287 [Diffusion] Optimize Hunyuan3D shape denoising

原始 PR · 作者 BBuf · 合并时间 2026-05-06 10:10

性能优化 重要性 7.21 洞察度 5.00

融合 norm/QK norm 路径,提升 24.9% 去噪延迟

值得精读,特别是 `_FluxRMSNorm.weight` 属性的暴露模式(兼容 checkpoint 与 fused 接口)和 `apply_qk_norm` 的使用方式。建议后续在类似模型中推广此 fusion 模式。

#24464 Add --random-input-len to send_one.py

原始 PR · 作者 merrymercy · 合并时间 2026-05-06 08:49

测试 重要性 5.11 洞察度 3.00

send_one.py 新增随机输入 len 参数

该 PR 代码清晰,改动集中,可直接合入。建议其他开发者在 profiling prefill 性能时使用 `--random-input-len` 参数。

缺陷修复 重要性 6.79 洞察度 4.00

处理 NIXL 远程断开异常,防止 KV 传输中断崩调度器

该 PR 值得精读,展示了在不改变外部接口的前提下,通过状态化错误处理来增强健壮性的实践。特别关注 commit 历史中从宽泛的 `RuntimeError` 捕获到精确异常捕获的演进过程,体现了防御式编程的设计权衡。

参与讨论