Prhub
← 返回仓库列表

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-04-19 12:24 同步状态:空闲 下次计划:2026-04-19 13:24

PR 列表

已合并 960 · 已分析 960
更多筛选
2026-04-12

#22281 [Bugfix] fix model_config deletion

作者 aurickq · 合并时间 2026-04-12 11:24

缺陷修复 重要性 4.00 洞察度 3.00

修复HTTP服务器和调度器在/server_info调用中意外删除model_config的问题。

该PR值得快速浏览,特别是关注状态管理中的突变问题修复模式。设计上展示了如何通过创建副本来避免副作用,这对类似场景有借鉴意义。

#22608 [CI] Little renaming of gb200 CI workflow

作者 Fridge003 · 合并时间 2026-04-12 08:52

基础设施 重要性 2.00 洞察度 1.00

重命名GB200 CI工作流文件,更新runner标签以明确72GPU配置。

此PR变更简单直接,无需精读。对于负责CI基础设施的工程师,可关注runner标签的命名规范,以确保与其他工作流的一致性。对于一般开发者,了解CI配置的清晰化趋势即可。

功能 重要性 7.00 洞察度 6.00

重构LoRA MoE runner为hook-based模式,并添加Marlin int4/int8后端支持。

该PR值得精读,重点关注hook-based设计决策如何平衡解耦与性能,以及Marlin后端集成中的量化处理。建议工程师review时检查维度计算逻辑,并考虑优化关键路径上的函数定义。

2026-04-11
重构 重要性 6.00 洞察度 5.00

重构内存检查器为可组合的每池检查,提升代码可维护性。

建议工程师精读本 PR,重点关注 `_check_pool_invariant` 的设计和 `on_idle` 方法的整合,以学习内存池检查的统一模式,重构值得关注以提升代码质量。

#22439 [diffusion]: add ERNIE-Image

作者 dyhsup · 合并时间 2026-04-11 17:18

功能 重要性 7.00 洞察度 6.00

为 SGLang 添加 ERNIE-Image 扩散文本到图像模型支持,包括模型架构和提示增强模块。

建议技术管理者和工程师精读此 PR,以了解扩散模型在 SGLang 中的集成模式,特别关注 PE 模块的设计决策和 API 扩展方式。对于代码评审者,应注意跨平台兼容性和异常处理的最佳实践。

缺陷修复 重要性 3.00 洞察度 3.00

修复工具调用测试的随机失败问题,通过添加strict=True确保参数模式强制约束。

该PR变更简单直接,无需深入阅读。值得关注的是gemini-code-assist[bot]的建议——考虑将strict=True一致地应用于其他相关测试用例,以全面消除随机失败风险。

功能 重要性 6.00 洞察度 5.00

将更快的 v2 分组量化内核设为默认,提升高负载性能。

该 PR 值得精读,特别是关注 v2 内核的默认启用逻辑和弃用环境变量的处理方式。设计决策包括基于组大小自动启用 v2 内核,以及平滑过渡的弃用机制,这些对于性能优化和向后兼容性有借鉴意义。

参与讨论