Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-04-20 17:25 同步状态:空闲 下次计划:2026-04-20 18:25

PR 列表

已合并 982 · 已分析 982
更多筛选
2026-04-03
缺陷修复 重要性 5.00 洞察度 6.00

修复ROCm/aiter后处理中权重替换丢失自定义属性问题,确保RL工作流正常。

建议精读unquant.py中的copy_or_rebind_param实现,理解其如何平衡原地更新与形状兼容;同时关注review中关于分片属性同步的讨论,这对分布式训练场景很重要。

#22014 [Misc] Update CI permission

原始 PR · 作者 Fridge003 · 合并时间 2026-04-03 14:37

基础设施 重要性 2.00 洞察度 1.00

将特定用户的CI权限冷却间隔从60分钟调整为0分钟,提升CI触发效率。

这是一个简单的配置更新,无需深入阅读代码。建议关注点:1. 了解CI权限管理机制,以便未来类似调整。2. 注意权限变更的安全和负载影响,确保有监控措施。

功能 重要性 6.00 洞察度 6.00

为 HiSparse 添加直接从 Prefill 传输缓存到 Decode DRAM 的支持。

建议技术管理者和工程师精读此 PR,重点关注 HiSparse 集成设计、传输逻辑优化以及与现有 disaggregation 系统的交互。设计决策如标志放置和索引处理值得借鉴,有助于理解高性能缓存管理的最佳实践。

基础设施 重要性 3.00 洞察度 3.00

修复内核发布工作流在push事件中跳过构建作业的问题。

该PR值得快速浏览,了解CI工作流触发条件的常见陷阱。关注点:GitHub Actions中push和workflow_dispatch事件参数差异,以及条件逻辑的设计模式。对于负责CI的工程师,可学习如何正确处理多事件类型的工作流。

基础设施 重要性 3.00 洞察度 2.00

移除内核版本更新工作流中的夜间测试触发,简化CI流程。

该PR变更简单直接,适合基础设施维护人员快速了解。值得关注的设计决策是:将内核版本同步与夜间测试解耦,这可能反映团队在优化CI流水线,区分不同职责的工作流。建议结合团队CI策略评估此变更的合理性。

#21447 chore: bump sgl-kernel version to 0.4.1

原始 PR · 作者 sglang-bot · 合并时间 2026-04-03 13:31

基础设施 重要性 2.00 洞察度 1.00

更新 sgl-kernel 依赖版本至 0.4.1,同步所有配置和版本文件。

此 PR 变更简单,无需深入代码审查。建议团队关注后续 CI 测试结果,并查看 sgl-kernel 0.4.1 的变更日志以了解具体更新内容。对于工程师,可以略读文件变更以确认版本号统一更新。

性能优化 重要性 5.00 洞察度 4.00

为AMD硬件添加2880隐藏维度到融合allreduce-RMSNorm启发式,修复GPT-OSS模型性能回归。

该PR值得快速浏览,以了解AMD硬件下融合allreduce的性能调优细节。关注点:1. fused_allreduce_rmsnorm函数中的启发式逻辑(隐藏维度集合和payload检查)。2. 性能测试结果展示了实际收益。3. review中关于未来重构的简短讨论,提示当前方法可能需改进。

重构 重要性 5.00 洞察度 5.00

统一 AMD 确定性 all reduce 代码路径,简化并行状态管理。

建议涉及分布式通信或 AMD 硬件支持的工程师精读此 PR,重点关注 _all_reduce_impl 方法的设计决策和统一路径的逻辑;对于其他开发者,了解变更概要即可,以跟踪代码演进。

参与讨论