Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 10:11 同步状态：空闲下次计划：2026-06-07 11:11

后台正在同步并分析最近 PR，页面会自动刷新并逐步显示最新结果。

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-04-23

#23060 [fix] Fix dynamic chunking profiling crash on GLM-5 models

原始 PR · 作者 Baichuan7 · 合并时间 2026-04-23 19:30

缺陷修复重要性 5.03 洞察度 3.00

修复动态分块profiling在GLM-5模型上的崩溃

建议合并，该修复精准定位了profiling路径中缺失的标志初始化问题，改动极小且正确性明确。

bugfixschedulingmoe

#23532 docs: add Hunyuan 3 Preview cookbook

原始 PR · 作者 JustinTong0323 · 合并时间 2026-04-23 17:44

文档重要性 7.30 洞察度 3.00

为 Hunyuan 3 Preview 添加部署 cookbook 和交互式生成器。

值得阅读的是交互式生成器的硬件配置逻辑（`generateCommand` 函数），它体现了 Blackwell 架构的特殊 attention backend 选择。其他部分为标准 cookbook 格式，适合作为文档编写参考。

documentationfeature

#23319 [AMD] Use bpreshuffle FP8 blockscale GEMM to replace ABScale GEMM

原始 PR · 作者 RolaoDenthu · 合并时间 2026-04-23 16:51

性能优化重要性 6.56 洞察度 7.00

用 bpreshuffle GEMM 替换 ABScale GEMM，提升 AMD FP8 块缩放性能。

本 PR 值得精读。其核心设计模式“一次性预处理（preshuffle）换取每次推理加速”在算子优化中具有代表性。AMD 平台性能验证充分，但需关注精度回归是否在可接受范围内。建议关注未来 Triton 路径扩展后，bpreshuffle 路径的覆盖变化。

amdperformancequant

#23382 [AMD] skip deterministic inference for MLA FP8 test

原始 PR · 作者 bingxche · 合并时间 2026-04-23 15:43

测试重要性 4.86 洞察度 3.00

为AMD CI跳过MLA FP8测试中的确定性推理标志，修复CI失败。

该PR值得快速浏览，以了解如何优雅处理跨平台CI测试中的后端差异。重点关注条件逻辑的设计，它展示了在存在上游bug时如何临时绕过问题而不破坏现有功能。对于涉及多后端支持的团队，这是一个实用的模式。

amdtestrun-ci

#23514 [CI][NPU]use rsproxy.cn mirror to speed up Rust toolchain installation on NPU runners

原始 PR · 作者 Goalina · 合并时间 2026-04-23 14:52

基础设施重要性 3.80 洞察度 2.00

为NPU CI配置Rust镜像加速器安装

该 PR 为基础设施优化，逻辑简单明确，建议合并。值得注意的设计点是使用成熟的第三方镜像（ByteDance rsproxy.cn）而非自建代理，降低了维护成本。

npucirun-ci

#23414 [bug fix] fix: detect FP8 weights from safetensors header instead of assuming FP8 by architecture name

原始 PR · 作者 yushengsu-thu · 合并时间 2026-04-23 14:49

缺陷修复重要性 6.84 洞察度 5.00

修复 DeepSeek 架构模型在 sm100 上错误默认 FP8 量化的问题，通过检查 safetensors 头文件正确检测权重类型。

建议精读此 PR，重点关注 `has_fp8_weights_in_checkpoint` 函数的设计决策（如使用 safetensors 头文件检测而非架构名称）以及 review 中指出的未解决问题。对于维护类似功能的工程师，此 PR 展示了如何通过元数据检测来避免硬编码假设，但需注意实现中的潜在缺陷。

bugfixrun-ciquant

#22500 [Observability] Add HTTP sidecar endpoints and FlushCache gRPC RPC for gRPC mode

原始 PR · 作者 Kangyan-Zhou · 合并时间 2026-04-23 14:06

功能重要性 7.85 洞察度 6.00

为 gRPC 模式添加 HTTP sidecar 端点和 FlushCache RPC

建议关注以下设计决策： - **profiling 端点放在 sidecar 而非 gRPC**：PD 模式需要 per-worker 定向，不应通过 router fan-out。 - **FlushCache 作为 gRPC RPC**：需要 fan-out 到所有 worker，因此通过 router 调度是合理的选择。 - **移除重复端点**：review 中及时删除了 sidecar 中多余的 /server_info，保持了单一实现。这些决策体现了对异构传输模式下功能划分的清晰思考，值得在类似场景复用。

observabilityfeaturemodel-gateway

#23198 [diffusion] Fix --warmup-resolutions hang with --enable-cfg-parallel

原始 PR · 作者 mispa-ms · 合并时间 2026-04-23 13:39

缺陷修复重要性 7.79 洞察度 5.00

修复CFG-parallel模式下warmup分辨率预热导致的30分钟静默挂起。

建议精读scheduler.py和input_validation.py的变更，关注设计决策如占位符常量的使用和验证逻辑的添加，这些体现了防御性编程和代码可维护性的权衡。

diffusionbugfixrun-ci

第 218 / 357 页 · 共 2850 条

上一页 1 … 216 217 218 219 220 … 357 下一页