Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 10:11 同步状态：空闲下次计划：2026-06-07 11:11

后台正在同步并分析最近 PR，页面会自动刷新并逐步显示最新结果。

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-05-05

#24407 [AMD] fix(docker): unbreak nightly when archive.ubuntu.com:80 is unreachable

原始 PR · 作者 yctseng0211 · 合并时间 2026-05-05 15:39

缺陷修复重要性 3.92 洞察度 3.00

修复 AMD Docker 构建因镜像不可达失败的问题

该 PR 是典型的基础设施修复，变更清晰、范围有限，适合快速合入。建议阅读 `docker/rocm.Dockerfile` 中的实现，了解如何在 Dockerfile 中优雅地处理源替换和 apt 网络硬化。

amddockerbugfix

#23146 [AMD] Enable EAGLE speculative decoding for Qwen3.5 FP8 and MXFP4 models with aiter's unified attention

原始 PR · 作者 hubertlu-tw · 合并时间 2026-05-05 15:09

功能重要性 7.97 洞察度 6.00

AMD启用EAGLE统一注意力验证并修复MXFP4加载

值得精读，尤其关注注意力后端如何适配不同数据类型（MLA/non-MLA）和投机解码布局（ragged vs paged）。设计决策（如保持radix-cache分离）体现了模块化思维。建议后续补充单元测试覆盖新路径。

amdfeaturespeculative-decoding

#23848 [AMD] Add Kimi-K2.6 in nightly tests for MI30x and MI35x

原始 PR · 作者 michaelzhang-ai · 合并时间 2026-05-05 14:37

测试重要性 7.74 洞察度 3.00

AMD 夜间测试从 K2.5 切换到 K2.6

值得关注的是 AMD 团队复用 K2.5 配置的策略，它验证了模型架构兼容性的实用检查。对于 review 中提到的 try-finally 清理模式，建议在后续 PR 中统一修改 accuracy 测试的服务器生命周期管理，以减少 CI 中的不确定失败。此外，可考虑将重复的报表生成函数抽取为公共工具，降低维护成本。

amdtestrun-ci

#24367 [docs] Update B300 Pro cookbook with accuracy-verified serving configs

原始 PR · 作者 yhyang201 · 合并时间 2026-05-05 14:26

documentation 重要性 7.18 洞察度 5.00

为 B300 Pro 更新准确性验证的部署配置

值得精读，特别是条件逻辑和准确性验证方法。建议关注 review 中未解决的条件范围问题，确保配置只针对目标硬件。设计决策中基于 SimpleQA 验证配置的方法值得借鉴。

documentationdeepseekperformance

#24304 [diffusion] feat: cache encoder results for default negative prompt

原始 PR · 作者 mickqian · 合并时间 2026-05-05 11:56

功能重要性 8.09 洞察度 5.00

缓存 diffusion 默认负提示文本编码结果，减少约 54% 编码延迟

值得精读，展示了在推理引擎中引入缓存时的典型设计考量：键范围选择、引用 vs 克隆的权衡、warmup 行为。适合作为性能优化的参考案例。

diffusionperformancefeature

#24400 [diffusion] CI: pin diffusion consistency GT revision

原始 PR · 作者 mickqian · 合并时间 2026-05-05 11:53

测试重要性 4.64 洞察度 5.00

固化 diffusion 一致性测试 GT 来源版本

值得精读，作为测试基础设施最佳实践示例——通过 pinned revision 消除外部依赖波动。

diffusiontest

#24246 (2/n - prefill optimize)perf(lora): remove GPU-CPU sync barrier (.item()) in MoE LoRA path and remove duplicate code

原始 PR · 作者 yushengsu-thu · 合并时间 2026-05-05 09:11

性能优化重要性 7.76 洞察度 6.00

移除MoE LoRA路径GPU同步屏障，预填性能提升6-8%

值得精读，尤其展示如何通过消除 `.item()` 同步屏障优化 GPU 利用率。设计决策（CPU 端提前判断替代 GPU 同步）具有参考价值。但需注意该 PR 无测试配套，建议后续补充。

performancelorarefactor

#24320 [diffusion] cli: support component attention backend overrides

原始 PR · 作者 mickqian · 合并时间 2026-05-05 08:39

功能重要性 9.18 洞察度 6.00

支持 diffusion 组件级 attention backend 覆盖

值得阅读，特别是 ContextVar 为基础的组件化上下文注入模式，以及命名解析与回退策略。若你负责扩散推理优化，此 PR 提供了灵活的扩展基准。

diffusionfeaturedocumentation

第 174 / 357 页 · 共 2850 条

上一页 1 … 172 173 174 175 176 … 357 下一页