Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 10:11 同步状态：空闲下次计划：2026-06-07 11:11

后台正在同步并分析最近 PR，页面会自动刷新并逐步显示最新结果。

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-05-02

#23182 [ci][cu13] Bump torch_memory_saver to 0.0.9.post1; restore manual tests

原始 PR · 作者 Kangyan-Zhou · 合并时间 2026-05-02 13:50

基础设施重要性 4.19 洞察度 2.00

升级 torch_memory_saver 并恢复 cu13 测试

值得合入。这是一个典型的依赖升级与测试恢复 PR，变更简洁明了。对于维护者而言，可以关注 `torch_memory_saver==0.0.9.post1` 在更广泛的 CUDA 版本上的稳定性，但就本 PR 而言风险已充分验证。

dependenciesci

#24264 [CI] Add 1-gpu-h100-h200 to rerun-test runner_label choices

原始 PR · 作者 Kangyan-Zhou · 合并时间 2026-05-02 13:45

基础设施重要性 2.26 洞察度 1.00

修复rerun-test缺少H100-H200 runner选项

该 PR 是 CI 配置的例行修复，技术洞察价值低，无需精读。但可作为 GitHub Actions 工作流配置的参考案例。

#24219 [diffusion] CI: change ground truth repo

原始 PR · 作者 mickqian · 合并时间 2026-05-02 12:25

基础设施重要性 3.67 洞察度 2.00

切换扩散 CI ground truth 数据源仓库

变更简单直接，但建议确认 sgl-project/ci-data 仓库已包含所需数据且 CI 测试通过。对于了解项目 CI 基础设施演进的读者有一定参考价值。

cidiffusion

#23496 [session] fix mamba pool leak in StreamingSession.release_session + plumb idle leak check

原始 PR · 作者 sshleifer · 合并时间 2026-05-02 11:38

缺陷修复重要性 6.81 洞察度 4.00

修复 StreamingSession 释放时 mamba 池泄露

建议合并。该 PR 修复了一个明确的资源泄露问题，并且代码质量良好，遵循了已有的 `session_held_*` 模式。如果可能，后续可添加对应的单元测试，但并非阻塞条件。

bugfixhicachememory-management

#23850 Support RunAI loading for quantized checkpoints

原始 PR · 作者 sshleifer · 合并时间 2026-05-02 11:11

功能重要性 8.19 洞察度 6.00

支持RunAI流式加载量化检查点

值得精读。该 PR 涉及模型加载架构的重要扩展，特别是流式生成器模式、缓冲区管理策略（`_clone_if_runai_streamed_tensor`）以及路由设计中的防御性编程，对理解 SGLang 的加载器体系有参考价值。

featuredeepseekquant

#24250 [SKILL] Upgrade sglang profile and auto_benchmark skills

原始 PR · 作者 BBuf · 合并时间 2026-05-02 10:12

功能重要性 8.75 洞察度 6.00

升级 AI-Infra 技能包，替换 benchmark 并新增 incident triage 与分阶段 profiler 脚本

值得阅读以了解 SGLang 生态中 AI-Infra 技能包的架构和设计思路，尤其是跨框架 benchmark 配置校验和分阶段 profiler 的实现。建议后续跟进 review 中的文档改进建议。

documentationbenchmarkrefactor

#23625 Flux2 nvfp4 quantization correctness on Blackwell (B200)

原始 PR · 作者 Johnsonms · 合并时间 2026-05-02 09:57

缺陷修复重要性 7.90 洞察度 6.00

修复 FLUX.2 NVFP4 在 B200 上的量化正确性

值得精读。关注 process_weights_after_loading 的条件化设计、per-GEMM z-score 调试方法。建议未来建立可配置命名映射机制。

quantbugfixdiffusion

#24169 Allow configuring NIXL backend parameters from env

原始 PR · 作者 aurickq · 合并时间 2026-05-02 09:30

功能重要性 5.82 洞察度 4.00

新增NIXL后端参数环境变量配置

值得快速查看以了解 NIXL 后端的参数注入机制。若团队后续需支持更多后端参数，可考虑采用字典映射重构线程参数注入部分，但当前保持原样也合理。

featurerun-ci

第 183 / 357 页 · 共 2850 条

上一页 1 … 181 182 183 184 185 … 357 下一页