Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 12:34 同步状态:空闲 下次计划:2026-06-07 13:34

PR 列表

更多筛选
2026-04-30
功能 重要性 9.18 洞察度 7.00

MLX 后端实现解码异步重叠调度

**值得精读**。该 PR 展示了如何利用 MLX 的 lazy evaluation 特性设计高效的 GPU 流水线,是 Apple Silicon 推理性能优化的核心里程碑。`SchedulerMlxOverlapMixin` 中的链式调度设计(两图链、链中断条件、`async_eval` 与 `finalize` 分离)具有较高参考价值。后续可以考虑扩展到 prefill/extend 链以及更鲁棒的 KV 缓存管理。

基础设施 重要性 3.13 洞察度 3.00

扩增 CI 测试 runner 池至 H100 和 H200

推荐合并前与运维确认 `1-gpu-h100-h200` 标签已正确添加到对应 runner 池。本 PR 逻辑简单,不涉及代码逻辑变更,但引用了 #23505 的模式,值得团队在后续扩池时参考。

缺陷修复 重要性 4.88 洞察度 4.00

修正 host leaf 状态检查条件 bug

建议精读此 PR 的讨论和实现,理解 HiCache 驱逐状态机的微妙之处。该修复展示了分布式缓存中状态字段语义必须精确对应业务含义的重要性。

基础设施 重要性 5.29 洞察度 3.00

添加 /rerun-group CI 命令,按测试组批量重跑

该 PR 作为一个 CI 工具改进,设计上提取公共权限检查、复用 dispatch 是值得肯定的。但是非递归 glob 问题需要修复,建议在合并前或后续 PR 中处理。整体上值得关注其设计模式,尤其是权限检查提取和组名解析的通用化思路。

2026-04-29

#24058 debug followup

原始 PR · 作者 JustinTong0323 · 合并时间 2026-04-29 23:03

功能 重要性 8.72 洞察度 6.00

为 Mistral Medium 3.5 添加 EAGLE 推测解码支持

建议精读 `mistral_eagle.py` 和 `mistral_utils.py` 中的配置分支设计,了解如何利用已有的 Llama EAGLE 框架支持新模型。该 PR 展示了 weight name remapping 和 quant_config 传递的实践,值得参考。

参与讨论