Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 12:34 同步状态：空闲下次计划：2026-06-07 13:34

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-04-03

#19246 [NPU] optimize glm4.7

原始 PR · 作者 randgun · 合并时间 2026-04-03 15:44

性能优化重要性 6.00 洞察度 7.00

为 NPU 硬件优化 GLM4.7 模型性能，引入双流处理和融合内核。

建议技术管理者关注此 PR 中的流管理设计和内核融合策略，对 NPU 优化或高性能计算感兴趣的工程师值得精读，特别是 `glm4_moe.py` 中的条件分支和同步逻辑，以及 review 中讨论的正确性验证要点。

npuperformancerun-ci

#22016 [PD] Tiny register info field cleanup for mooncake backend

原始 PR · 作者 ShangmingCai · 合并时间 2026-04-03 15:13

重构重要性 2.00 洞察度 1.00

将mooncake后端中可选staging字段移至类定义末尾，提升代码清晰度。

这是一个简单的代码清理PR，无需深入精读。对于关注mooncake后端或代码风格的开发者，可以快速浏览以了解字段顺序的最佳实践。

refactordocumentationrun-ci

#22007 fix: remove duplicate words in comments

原始 PR · 作者 Ricardo-M-L · 合并时间 2026-04-03 15:05

重构重要性 2.00 洞察度 1.00

修复四个文件注释中的重复单词，提升代码文档质量。

该PR不值得精读，除非您特别关注代码文档质量或相关模块的注释细节。对于工程师，可以快速浏览以了解团队对文档清理的重视；对于管理者，可作为代码质量持续改进的示例。无需深入分析设计决策，因为这是简单的文本修正。

refactordocumentationrun-ci

#22001 [CI] Fix duplicate job names that bypass branch protection

原始 PR · 作者 hnyls2002 · 合并时间 2026-04-03 14:59

基础设施重要性 5.00 洞察度 4.00

修复 GitHub 工作流中重复作业名称，防止分支保护绕过。

建议技术管理者关注此 PR 作为 CI 最佳实践，特别是涉及分支保护的工作流设计。工程师可以精读 scripts/ci/check_workflow_job_names.py 脚本，学习如何通过预提交钩子自动化检查配置错误，并应用到其他类似场景。

run-cisecurity

#21825 [ROCM][RL] Shuffle Weight In-Place to Preserve Parameter Attributes

原始 PR · 作者 zyzshishui · 合并时间 2026-04-03 14:43

缺陷修复重要性 5.00 洞察度 6.00

修复ROCm/aiter后处理中权重替换丢失自定义属性问题，确保RL工作流正常。

建议精读unquant.py中的copy_or_rebind_param实现，理解其如何平衡原地更新与形状兼容；同时关注review中关于分片属性同步的讨论，这对分布式训练场景很重要。

quantrun-cibugfix

#22014 [Misc] Update CI permission

原始 PR · 作者 Fridge003 · 合并时间 2026-04-03 14:37

基础设施重要性 2.00 洞察度 1.00

将特定用户的CI权限冷却间隔从60分钟调整为0分钟，提升CI触发效率。

这是一个简单的配置更新，无需深入阅读代码。建议关注点：1. 了解CI权限管理机制，以便未来类似调整。2. 注意权限变更的安全和负载影响，确保有监控措施。

run-ciconsistency

#21591 [PD]: Add support for HiSparse to directly transfer the cache from Prefill to Decode DRAM.

原始 PR · 作者 hzh0425 · 合并时间 2026-04-03 14:06

功能重要性 6.00 洞察度 6.00

为 HiSparse 添加直接从 Prefill 传输缓存到 Decode DRAM 的支持。

建议技术管理者和工程师精读此 PR，重点关注 HiSparse 集成设计、传输逻辑优化以及与现有 disaggregation 系统的交互。设计决策如标志放置和索引处理值得借鉴，有助于理解高性能缓存管理的最佳实践。

hicacheperformancefeature

#22011 [Workflow] Fix kernel release jobs skipped on push events

原始 PR · 作者 Fridge003 · 合并时间 2026-04-03 14:03

基础设施重要性 3.00 洞察度 3.00

修复内核发布工作流在push事件中跳过构建作业的问题。

该PR值得快速浏览，了解CI工作流触发条件的常见陷阱。关注点：GitHub Actions中push和workflow_dispatch事件参数差异，以及条件逻辑的设计模式。对于负责CI的工程师，可学习如何正确处理多事件类型的工作流。

run-ci

第 303 / 357 页 · 共 2850 条

上一页 1 … 301 302 303 304 305 … 357 下一页