Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 12:34 同步状态：空闲下次计划：2026-06-07 13:34

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-04-03

#17985 [MUSA][9/N] Add FA3 attention backend support through MATE (MUSA AI Tensor Engine)

原始 PR · 作者 froststeam · 合并时间 2026-04-03 06:04

功能重要性 7.00 洞察度 6.00

为 MUSA GPU 添加基于 MATE 的 FA3 注意力后端支持。

建议技术管理者和工程师精读此 PR，以了解 MUSA 硬件集成策略。重点关注 `get_flash_attention_context` 方法和调度元数据注入机制的设计决策，以及 review 中关于性能与抽象的权衡讨论。对于涉及多平台支持的开发者，可参考此 PR 的 vendor-isolated 模式。

featuredependenciesrun-ci

#21570 [4/n] Support gpt oss 20b lora

原始 PR · 作者 yushengsu-thu · 合并时间 2026-04-03 03:57

功能重要性 6.00 洞察度 6.00

为 GPT-OSS-20B 模型添加 LoRA 支持，并引入严格 CI 测试。

建议技术管理者和工程师精读此 PR，特别关注 `layers.py` 中的 bias 处理逻辑和 MoE 支持实现，这些设计决策对分布式训练和推理有重要影响。同时，应评估 Copilot 提出的兼容性风险，并计划在后续 PR 中修复。

lorarun-cifeature

#21968 Remove logging for subprocess watchdog start

原始 PR · 作者 merrymercy · 合并时间 2026-04-03 02:30

重构重要性 2.00 洞察度 1.00

移除子进程监控启动时的日志输出，减少日志噪音。

该PR变更简单直接，无需精读。值得关注的是团队对日志噪音的持续优化倾向，以及类似工具类代码的简洁性追求。对于维护类似监控组件的开发者，可参考这种移除低价值日志的做法。

refactorrun-ci

#21740 [CI] [Tracing] Add ci for tracing and fix bugs

原始 PR · 作者 sufeng-buaa · 合并时间 2026-04-03 01:50

基础设施重要性 5.00 洞察度 5.00

添加跟踪集成测试至CI并修复tokenizer manager中的bug。

建议CI维护者和测试工程师精读此PR，重点关注轻量级OTLP收集器的设计、测试优化技巧以及安全绑定实践，以借鉴于其他基础设施测试中。

run-citestdebugging

#21955 [diffusion] chore: fix stage profiler for multi-stage denoising

原始 PR · 作者 mickqian · 合并时间 2026-04-03 01:16

缺陷修复重要性 4.00 洞察度 5.00

修复多阶段去噪场景下性能分析器记录步骤时序错误的问题。

该PR值得精读，展示了性能分析工具如何适配复杂场景（多阶段去噪）的设计决策。重点关注：1) StageProfiler如何通过record_as_step标志解耦阶段名称约定和业务逻辑。2) 从index-based到顺序记录的简化设计。3) 同步逻辑（SGLANG_DIFFUSION_SYNC_STAGE_PROFILING）与步骤记录的关联。

diffusionbugfixrun-ci

#20866 [parallel_state Refactor 1/n] Remove stream of PyNCCL

原始 PR · 作者 DarkSharpness · 合并时间 2026-04-03 00:47

重构重要性 5.00 洞察度 5.00

移除PyNCCL中的stream管理，简化分布式通信后端逻辑。

建议精读此PR以理解分布式通信中stream管理的简化设计，关注`change_state`上下文管理器和异步操作处理。对于从事类似重构的工程师，这是一个良好的代码清理案例，但需注意review中提到的异常安全性和资源管理建议。

refactorrun-ciconsistency

#21950 [CI] Fix gpu deps import in cpu test

原始 PR · 作者 ispobock · 合并时间 2026-04-03 00:06

基础设施重要性 4.00 洞察度 4.00

修复CPU测试中GPU依赖导入失败问题，增强CI稳定性。

此PR值得快速浏览，特别是 `maybe_stub_sgl_kernel()` 函数的实现，展示了如何在Python中动态stub模块以支持跨环境测试。对于维护CI测试的工程师，这是一个有用的参考，可学习如何处理硬件依赖的导入问题。

documentationrun-ci

2026-04-02

#21408 [NPU] Support GLM-4.7-Flash on NPU

原始 PR · 作者 Todobe · 合并时间 2026-04-02 17:44

功能重要性 6.00 洞察度 6.00

支持 GLM-4.7-Flash 模型在 NPU 硬件上运行，添加注意力头填充适配。

建议工程师精读此 PR，关注注意力后端中填充策略的设计和硬件限制的适配，这对于理解 NPU 特定优化和模型兼容性处理有价值。

npufeaturerun-ci

第 306 / 357 页 · 共 2850 条

上一页 1 … 304 305 306 307 308 … 357 下一页