Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 12:34 同步状态:空闲 下次计划:2026-06-07 13:34

PR 列表

更多筛选
2026-04-23
缺陷修复 重要性 7.72 洞察度 5.00

修复MUSA后端Context Parallel注意力前向扩展的输出垃圾问题,确保CP工作负载在MUSA设备上正常运行。

此PR值得精读,特别是关注`musa_cp_attn_forward_extend`函数的设计和级联注意力逻辑的调整。对于在MUSA后端上实现CP支持的工程师,这些变更提供了重要的兼容性解决方案和代码组织范例。

文档 重要性 6.56 洞察度 3.00

为旧版文档网站添加弃用通知横幅,引导用户至新站点。

对于文档维护者,此PR值得关注以了解如何集成弃用横幅到静态网站;对于工程师,可快速浏览CI脚本变更以理解允许列表机制,但无需深入阅读。

基础设施 重要性 2.75 洞察度 1.00

Intel GPU Docker 镜像 Python 版本升级至 3.12

该 PR 属于常规依赖版本升级,技术含量低,无需精读。可关注后续镜像构建是否顺利,以及是否有其他 Python 3.12 兼容性问题出现。

基础设施 重要性 4.58 洞察度 4.00

修复CI中sgl-kernel wheel构建矩阵,同时支持cu129和cu130以避免测试静默失败。

建议团队在修改sgl-kernel时关注此PR,确保CI能正确测试内核变更。对于CI维护者,这是一个重要的配置修复,值得了解wheel选择逻辑和兼容性处理。

基础设施 重要性 3.27 洞察度 4.00

修复CI中/rerun-stage命令在sgl-kernel PR上无法正确生成工作流运行URL的问题。

该PR变更简单直接,适合CI维护者快速浏览以理解变量同步的重要性。值得关注的设计决策是确保本地变量与工作流输入的一致性,避免因元数据不匹配导致的功能降级。

基础设施 重要性 3.21 洞察度 2.00

扩展CI中B200测试任务的runner选择范围,支持低磁盘标签以提升调度弹性。

该PR变更简单直接,主要涉及CI配置调整。对于关注CI基础设施或B200测试环境的工程师,可以快速浏览以了解runner标签的使用策略;对于其他开发者,无需深入阅读。

#23503 fix retrive -> retrieve typo

原始 PR · 作者 hnyls2002 · 合并时间 2026-04-23 07:35

缺陷修复 重要性 6.44 洞察度 2.00

修复Python侧'retrive'拼写错误为'retrieve',保持内核兼容性。

该PR值得快速浏览以了解拼写标准化和内核兼容性设计;对于新贡献者,可关注如何在保持向后兼容的前提下进行重命名。

缺陷修复 重要性 8.29 洞察度 7.00

修复 EP + MoE LoRA 非法内存访问

建议深入阅读此 PR,特别是 `_get_moe_ep_context`、`_moe_runner_keeps_global_expert_ids` 的异常安全设计和 `_iter_local_expert_weights` 的字典/张量统一处理模式。这是如何在多个模块(内存池、CUDA 内核、调度器)间协调 EP 行为的典型案例,值得在类似分布式重构中参考。

参与讨论