Prhub
← 返回仓库列表

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-04-19 06:05 同步状态:空闲 下次计划:2026-04-19 07:05

PR 列表

已合并 960 · 已分析 960
更多筛选
2026-03-26
重构 重要性 5.00 洞察度 4.00

重构扩散JIT内核测试布局并收窄CI触发范围。

建议关注此PR以了解扩散JIT内核测试的组织优化和CI触发策略,特别是对于从事测试基础设施或CI配置的工程师,值得精读 `test/run_suite.py` 和CI工作流文件的变更,但整体变更较直接,可快速浏览。

缺陷修复 重要性 5.00 洞察度 5.00

增强killall.py脚本的诊断能力,添加PID命名空间检查和进程列表输出以解决CI中GPU内存清理失败问题。

建议涉及CI管理或容器环境调试的工程师精读此PR,关注其PID命名空间检查、进程匹配和日志结构的设计决策,这些对类似共享GPU容器的调试有借鉴价值。

#21004 [Fix] Add EPLB rebalance support for Kimi K2.5

作者 yafengio · 合并时间 2026-03-26 12:01

缺陷修复 重要性 4.00 洞察度 2.00

为Kimi K2.5模型添加EPLB负载均衡所需的routed_experts_weights_of_layer属性,修复AttributeError。

该PR变更简单直接,是典型的缺失属性修复。对于关注Kimi模型支持或EPLB负载均衡机制的工程师,可快速浏览以了解模型类如何暴露专家权重信息。无需深入分析代码逻辑。

#21296 [MUSA] apply_vocab_mask support musa device

作者 froststeam · 合并时间 2026-03-26 12:00

功能 重要性 5.00 洞察度 3.00

为xgrammar后端的apply_vocab_mask添加MUSA设备支持,扩展硬件兼容性。

这是一个简单的功能扩展PR,变更直接且风险低。建议工程师快速阅读以了解设备支持扩展模式,特别是如何更新设备检查逻辑。对于关注多硬件兼容性的开发者,可以借鉴此PR的代码重构方式(使用集合提高可读性),但无深层次设计决策需要精读。

功能 重要性 6.00 洞察度 5.00

为 MUSA 平台启用分片 CUDA 图支持,扩展硬件兼容性。

该 PR 值得精读,特别是对于涉及 MUSA 平台或 CUDA 图优化的开发者。关注设计决策如硬件检测逻辑的扩展(通过 is_musa() 函数)和弱引用张量操作的跨平台注册模式,这体现了框架在异构硬件支持上的技术权衡。

#20782 [MPS] Add StreamContext stub

作者 yeahdongcn · 合并时间 2026-03-26 11:59

缺陷修复 重要性 5.00 洞察度 2.00

添加 StreamContext stub 修复 MPS 后端启动崩溃问题。

该 PR 变更简单,设计直白,适合快速浏览以了解 MPS 兼容性修复。对于深入理解存根模式或设备抽象层有参考价值。

#20753 [MPS] Support sglang.check_env

作者 yeahdongcn · 合并时间 2026-03-26 11:59

缺陷修复 重要性 4.00 洞察度 4.00

添加MPS环境检查类以修复check_env脚本在Apple Silicon上的失败。

建议精读此PR以学习如何在SGLang中添加新硬件环境检查模块;特别关注错误处理的设计决策和review中讨论的改进点,这对于编写健壮的跨平台代码具有参考价值。

参与讨论