Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 12:34 同步状态：空闲下次计划：2026-06-07 13:34

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-05-20

#25817 fix: add missing distro dependency to runtime docker image

原始 PR · 作者 mvanhorn · 合并时间 2026-05-20 15:46

缺陷修复重要性 3.09 洞察度 3.00

向 sglang 运行时添加缺失的 distro 依赖

值得合并，修复明确、改动微小且经过充分测试计划验证。该 PR 也展示了在处理 Docker 镜像依赖丢失问题时，在 `pyproject.toml` 层面声明依赖是最直接可靠的方案。未来若其他依赖也遇到类似问题，可参考此 PR。

dependenciesbugfixinfra

#22669 feat: Support flashinfer_cutedsl MoE runner with flashinfer alltoall backend

原始 PR · 作者 samuellees · 合并时间 2026-05-20 15:36

功能重要性 8.38 洞察度 7.00

CuteDSL FP4 MoE 集成 FlashInfer alltoall

如果正在部署 Qwen3.5-397B-A17B-NVFP4 或其他 Blackwell FP4 大 MoE 模型且使用 DP+EP，建议仔细阅读此 PR 以理解 idle rank 处理和 alltoall 集成细节。关注重点包括强制禁用 NVFP4 dispatch 的权衡、sanitize kernel 的必要性、以及 buffer 大小配置的内存影响。目前 PR 已合并，后续可跟踪 NVFP4 dispatch 的支持进展。

quantperformancefeature

#25861 Update CODEOWNERS to replace 'nsa' with 'dsa'

原始 PR · 作者 ch-wan · 合并时间 2026-05-20 15:31

重构重要性 2.42 洞察度 1.00

CODEOWNERS 中 nsa 改为 dsa

该 PR 属于常规的维护性变更，无技术深度，无需精读。但值得学习的是：CODEOWNERS 应与实际代码目录保持同步，以维持自动化审查的正确性。建议未来类似变更时考虑 review 中提出的字母顺序建议，以保持文件可维护性。

infrarefactor

#25854 ci(sgl-router): add PR test workflow (pre-positioned for feature PR)

原始 PR · 作者 Kangyan-Zhou · 合并时间 2026-05-20 15:20

基础设施重要性 5.98 洞察度 6.00

预置 sgl-router 的 PR 测试 CI 工作流

此 PR 虽仅为一个工作流文件，但其设计思路值得阅读： 1. 提前部署 CI 基础设施，消除大型 PR 的阻塞点。 2. pin-free 安装 vs 固定版本的权衡。 3. 多层流水线 + SHA 校验的供应链安全实践。 4. 使用 continue-on-error 处理 sccache 安装失败，提升 CI 鲁棒性。对于管理大型工程项目 CI 的读者参考价值高。

ciinfrarun-ci

#25821 [Refactor] Rename NSA → DSA: user-facing aliases, file/class/import rename

原始 PR · 作者 ch-wan · 合并时间 2026-05-20 15:18

重构重要性 9.18 洞察度 8.00

NSA 全面重命名为 DSA，保留向后兼容别名

该 PR 是大规模重命名的优秀范例，值得精读学习如何设计向后兼容的别名机制、分步骤迁移、以及使用 git mv 和 shim 文件。重点关注 `environ.py` 中的 `_DeprecatedEnvFallback` 混合类和 `server_args.py` 中的 `DeprecatedAliasStoreAction` 实现。

refactordeepseekinfra

#25814 Update GLM-5 H200 FP8

原始 PR · 作者 faradawn · 合并时间 2026-05-20 14:44

其他重要性 3.67 洞察度 2.00

GLM-5 部署脚本启用 flashinfer allreduce fusion

值得关注的是文档和交互组件与真实部署配置的一致性维护方式。后续类似硬件配置优化可参考此模式。

documentationinfraperformance

#25359 [Docs] MiMo-V2.5 cookbook: B200 benchmarks + multi-layer EAGLE acceptance profile + long-context reference

原始 PR · 作者 JustinTong0323 · 合并时间 2026-05-20 14:15

文档重要性 4.84 洞察度 4.00

MiMo-V2.5 cookbook 填充 B200 基准测试并启用 Blackwell 多层 EAGLE

建议 MiMo-V2.5 用户阅读此 cookbook 获取 B200 性能数据和多层 EAGLE 配置说明。文档展示了多 EAGLE 层接受率的实际影响，对性能调优有参考价值。

documentationperformance

#25356 [AMD] test(sgl-kernel): seed RNG on ROCm in test_moe_topk_sigmoid to fix tie-break flake

原始 PR · 作者 michaelzhang-ai · 合并时间 2026-05-20 14:01

缺陷修复重要性 4.81 洞察度 4.00

为 AMD 测试添加确定性种子修复偶发失败

建议精读。这是一个小而精的测试修复案例，展示了如何通过最小侵入性修改（单文件 +8 行）解决平台相关的随机性问题，值得测试工程师参考。

sgl-kernelamdbugfix

第 94 / 357 页 · 共 2850 条

上一页 1 … 92 93 94 95 96 … 357 下一页