Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 12:34 同步状态：空闲下次计划：2026-06-07 13:34

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-04-24

#23588 [PD+DP] Allow PrefillDelayer in disaggregated-prefill mode

原始 PR · 作者 ByronHsu · 合并时间 2026-04-24 05:51

功能重要性 6.62 洞察度 6.00

解除PrefillDelayer在disaggregated-prefill模式下的限制

该PR值得精读，尤其是理解PrefillDelayer的设计原理及其在disaggregated场景下的适配逻辑。变更加少了代码约束，提高了调度组件的灵活性，且性能收益明确。建议合并。

performanceschedulingfeature

#22541 [CI] Consolidate Docker release workflows into reusable workflow

原始 PR · 作者 Kangyan-Zhou · 合并时间 2026-04-24 05:06

基础设施重要性 6.10 洞察度 6.00

提取Docker构建逻辑为可复用工作流，简化3个发布工作流

值得精读，特别对于负责CI/CD的工程师。展示了如何通过`workflow_call`将重复的Docker构建逻辑抽取为可复用工作流，减少冗余代码并统一构建参数。关键设计决策包括：使用job outputs代替artifact传递digest、通过JSON tag_config灵活生成多架构标签、暴露`image_repo`支持测试环境。建议合并前按PR body中的测试计划手动触发验证。

cidocker

#23542 [bug fix] has_fp8_weights_in_checkpoint: handle HF repo IDs, not just local paths

原始 PR · 作者 alexnails · 合并时间 2026-04-24 03:56

缺陷修复重要性 7.16 洞察度 5.00

修复FP8权重检测对HF repo ID的支持

建议阅读此PR，它是#23414的紧密跟进，展示了一个好的模式：通过策略模式（本地/远程）抽象文件系统操作，避免在核心逻辑中分散if-else。后续应添加单元测试来覆盖远程路径。

bugfixrun-ciquant

#23540 docs: split MI300X and MI325X options in GLM-5.1 generator

原始 PR · 作者 zijiexia · 合并时间 2026-04-24 03:01

重构重要性 4.41 洞察度 3.00

拆分MI300X/MI325X选项并排序文档导航

值得快速浏览以了解如何将聚合硬件选项拆分为独立选项，以及如何使用 `.includes()` 统一分散的条件判断。但无需深入精读，因不涉及核心代码或性能变化。关注 review 中提到的 FP8 文档与实现不一致的问题，建议在后续 PR 中对齐。

documentationrun-ci

#22778 [BUGFIX]Fix Ascend backend pre-allocated range in NPU Graph Mode.

原始 PR · 作者 WangHao-hw · 合并时间 2026-04-24 01:23

缺陷修复重要性 5.79 洞察度 5.00

修复NPU Graph Mode中block_tables预分配不足问题

该PR值得相关开发者精读，尤其是维护NPU后端和Graph Mode特性的工程师。它揭示了一个常见的边界问题：预分配内存时未考虑推测解码产生的额外令牌。设计决策上体现了“在初始化阶段一次性预留足够内存”的容错思路，避免了运行时动态增长的复杂性。

npubugfixrun-ci

#23426 Fix: fallback to torch API when NVML memory query is not supported

原始 PR · 作者 AethoceSora · 合并时间 2026-04-24 00:26

缺陷修复重要性 5.86 洞察度 4.00

NVML内存查询回退到PyTorch API

该PR值得精读，适合作为防御性编程和兼容性处理的示例。核心设计决策是：当底层工具（NVML）不支持时，优雅回退到标准PyTorch API，而非让整个进程崩溃。该方法可以推广到其他类似的硬件查询场景。

bugfixrun-cidiffusion

#21254 feat: add OpenTelemetry tracing to DiffGenerator

原始 PR · 作者 jh-nv · 合并时间 2026-04-24 00:25

功能重要性 9.12 洞察度 7.00

为DiffGenerator添加OpenTelemetry追踪基础设施

此PR值得精读，尤其关注：1）如何将OTel追踪集成到多进程架构中（worker进程独立初始化）；2）通过上下文管理器封装复用追踪逻辑；3）跨分解角色传播追踪上下文的序列化方案；4）轻量级进程内OTLP收集器的实现（替代Docker依赖）。

featurediffusionobservability

#23572 [Diffusion][NPU][Bugfix] Ascend_fa crashes when sequence parallelism is used.

原始 PR · 作者 Napkin-AI · 合并时间 2026-04-24 00:21

缺陷修复重要性 5.25 洞察度 4.00

修复AscendFA在序列并行时头数参数不正确

建议合并。这是一个定位准确、改动量小的bug修复，修复了NPU AscendFA后端在序列并行下的关键崩溃。review建议已被采纳，代码清晰。后续可考虑添加单元测试覆盖sp-degree>1的场景。

npubugfixdiffusion

第 217 / 357 页 · 共 2850 条

上一页 1 … 215 216 217 218 219 … 357 下一页