Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 12:34 同步状态:空闲 下次计划:2026-06-07 13:34

PR 列表

更多筛选
2026-04-28

#23836 [diffusion] chore: change default seed to 42

原始 PR · 作者 mickqian · 合并时间 2026-04-28 20:39

重构 重要性 7.73 洞察度 5.00

默认种子改为42,重构partitioning与disagg种子传递

建议关注 partitioning 模块提取的设计(单一职责、可复用)、DenoisingContext 数据类与字典返回的权衡、disagg 种子传递的演进。该 PR 展示了增量重构与特性增强的合并模式,适合用于学习渐进式重构。

#23912 feat: tiny improve fp8_gemm tune usage

原始 PR · 作者 Muqi1029 · 合并时间 2026-04-28 19:47

重构 重要性 5.86 洞察度 3.00

改善 FP8 GEMM 调优脚本可用性与负载均衡

可直接合并。该 PR 虽小,但参数命名和负载均衡等改进符合作者提出的动机。建议后续考虑添加单元测试覆盖调优脚本的边界情况。

#23921 [SKILL] Sync SGLang skill docs

原始 PR · 作者 BBuf · 合并时间 2026-04-28 17:05

重构 重要性 9.00 洞察度 5.00

统一 torch profiler 分析脚本并更新 CI 技能文档

建议合并,代码质量良好,review 建议可后续单独修复 runner 命名问题。值得关注的设计决策是 profiler 分析脚本的统一化架构,特别是跨框架的 `canonicalize_framework` 和 `normalize_repo_relative_path` 设计。

功能 重要性 7.66 洞察度 5.00

为 PP pipeline 添加 OpenTelemetry 追踪

值得精读。PR 展示了如何在调度循环的轻量热路径中注入可观测性代码,设计上注重最小侵入和性能开销控制。命名讨论和属性传递方式的简化体现了对可维护性的关注,可作为同类追踪功能的参考模式。

#15771 [6/N] (Elastic EP) Recover failed ranks

原始 PR · 作者 UNIDY2002 · 合并时间 2026-04-28 15:44

功能 重要性 8.98 洞察度 7.00

实现 Elastic EP 失败进程恢复与动态重新加入

值得精读,特别是对分布式系统和容错机制感兴趣的开发者。该 PR 展示了如何在不阻塞在线服务的前提下恢复失败节点,设计上的权衡(如同步与异步、性能与可靠性)具有教育意义。但需注意当前实现依赖 Mooncake 库的内部语义,通用性受限;性能优化留给后续 PR。

缺陷修复 重要性 5.64 洞察度 3.00

修复 Eagle 模式下 draft 与 target 张量文件路径冲突

值得合并,修复明确、改动小且有测试(虽无自动化测试但手动验证可行)。设计决策上,将角色判断放在模型 runner 层而非 hook 层是合理的,保持了 hook 接口的纯净。文档配套同步值得赞扬。

#23355 Remove smoke wording from tests and comments

原始 PR · 作者 BBuf · 合并时间 2026-04-28 12:05

重构 重要性 5.93 洞察度 2.00

移除测试和注释中的 'smoke' 措辞

该 PR 属于纯代码清理,不涉及功能变更,适合在代码审查中快速过目。对于追求代码术语一致性的项目,这是一个可取的实践。建议关注 gemini-code-assist 提出的不一致问题,确保后续修复。

参与讨论