Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-13 17:27 同步状态:空闲 下次计划:2026-06-13 18:27

PR 列表

更多筛选
2026-04-29

#23947 [Docs] add cookbook for Ling-2.6 family

原始 PR · 作者 JustinTong0323 · 合并时间 2026-04-29 00:42

文档 重要性 8.44 洞察度 5.00

新增Ling-2.6 cookbook与交互部署选择器

建议阅读此PR以了解如何在SGLang文档中添加新模型cookbook,特别是thinking模式的文档处理和parser兼容性说明。也值得关注review中提出的import问题,确保后续文档PR都包含正确的React import。对于未使用的hardware选择器,应在后续PR中完善。

2026-04-28
基础设施 重要性 2.60 洞察度 2.00

AMD CI 超时提升至 150 分钟

简单直接的 CI 修复,无需精读。但值得注意:团队应评估是否需要在 AMD 工作流中增加模型缓存或预下载步骤,从根本上解决下载慢的问题,而不仅仅是扩大超时。

文档 重要性 5.66 洞察度 3.00

新增 H200 单节点 DeepSeek-V4-Pro 低延迟部署方案

对于文档维护者,建议:1) 核实并修正模型路径以确保 H200 兼容性;2) 考虑提取验证逻辑为辅助函数避免重复。对于普通读者,此 PR 属于纯文档增强,无需深入代码细节,但可参考其中的参数组合了解 H200 上 DeepSeek-V4-Pro 的典型低延迟配置。

#23836 [diffusion] chore: change default seed to 42

原始 PR · 作者 mickqian · 合并时间 2026-04-28 20:39

重构 重要性 7.73 洞察度 5.00

默认种子改为42,重构partitioning与disagg种子传递

建议关注 partitioning 模块提取的设计(单一职责、可复用)、DenoisingContext 数据类与字典返回的权衡、disagg 种子传递的演进。该 PR 展示了增量重构与特性增强的合并模式,适合用于学习渐进式重构。

#23912 feat: tiny improve fp8_gemm tune usage

原始 PR · 作者 Muqi1029 · 合并时间 2026-04-28 19:47

重构 重要性 5.86 洞察度 3.00

改善 FP8 GEMM 调优脚本可用性与负载均衡

可直接合并。该 PR 虽小,但参数命名和负载均衡等改进符合作者提出的动机。建议后续考虑添加单元测试覆盖调优脚本的边界情况。

#23921 [SKILL] Sync SGLang skill docs

原始 PR · 作者 BBuf · 合并时间 2026-04-28 17:05

重构 重要性 9.00 洞察度 5.00

统一 torch profiler 分析脚本并更新 CI 技能文档

建议合并,代码质量良好,review 建议可后续单独修复 runner 命名问题。值得关注的设计决策是 profiler 分析脚本的统一化架构,特别是跨框架的 `canonicalize_framework` 和 `normalize_repo_relative_path` 设计。

功能 重要性 7.66 洞察度 5.00

为 PP pipeline 添加 OpenTelemetry 追踪

值得精读。PR 展示了如何在调度循环的轻量热路径中注入可观测性代码,设计上注重最小侵入和性能开销控制。命名讨论和属性传递方式的简化体现了对可维护性的关注,可作为同类追踪功能的参考模式。

#15771 [6/N] (Elastic EP) Recover failed ranks

原始 PR · 作者 UNIDY2002 · 合并时间 2026-04-28 15:44

功能 重要性 8.98 洞察度 7.00

实现 Elastic EP 失败进程恢复与动态重新加入

值得精读,特别是对分布式系统和容错机制感兴趣的开发者。该 PR 展示了如何在不阻塞在线服务的前提下恢复失败节点,设计上的权衡(如同步与异步、性能与可靠性)具有教育意义。但需注意当前实现依赖 Mooncake 库的内部语义,通用性受限;性能优化留给后续 PR。

参与讨论