Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 10:11 同步状态：空闲下次计划：2026-06-07 11:11

后台正在同步并分析最近 PR，页面会自动刷新并逐步显示最新结果。

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-06-06

#27440 [Diffusion] Avoid GPU syncs in UniPC scheduler

原始 PR · 作者 BBuf · 合并时间 2026-06-06 22:01

性能优化重要性 6.14 洞察度 6.00

用 torch.stack 替换 torch.tensor 避免 GPU 同步

值得精读，尤其关注如何在推理框架中通过简单代码替换消除隐式 GPU-CPU 同步。建议后续考虑采纳 reviewer 的 `torch.ones_like` 简化建议。

diffusionperformancebugfix

#26356 [NPU]Support torch_npu profiler patch API drift

原始 PR · 作者 L4-1024 · 合并时间 2026-06-06 21:27

缺陷修复重要性 7.20 洞察度 4.00

新增 torch_npu 补丁 API 兼容层并更新调用方

建议 NPU 相关开发者阅读，该 PR 展示了如何平滑处理上游库的 API 漂移，并提供了可复用的兼容函数。单元测试覆盖了三种场景，值得参考。

npubugfixdiffusion

#27390 [SPEC] fix: import copy module for eagle sampling info clone

原始 PR · 作者 alphabetc1 · 合并时间 2026-06-06 20:12

缺陷修复重要性 4.53 洞察度 2.00

修复 Eagle 采样信息 deepcopy 导入错误

此 PR 改动较小，但修复了一个运行时异常，建议尽快合并。开发者可了解 import 方式对命名空间的影响。

bugfixspeculative-decodingdebugging

#26731 [NPU] Update documentation for software version upgrades

原始 PR · 作者 OrangeRedeng · 合并时间 2026-06-06 20:06

文档重要性 4.08 洞察度 2.00

更新 NPU 文档与 CI/Docker 配置以支持软件版本升级

该 PR 属于常规文档和配置更新，无需要重点关注的技术决策。NPU 相关开发者和用户可阅读了解最新版本要求。

documentationnpuinfra

#27426 Fix flaky test_self_e2e_pd_perturb

原始 PR · 作者 fzyzcjy · 合并时间 2026-06-06 19:31

缺陷修复重要性 5.10 洞察度 7.00

修复KV校验测试因Radix缓存去重导致的flaky问题

值得精读PR body中的根因分析，它揭示了`cache_unfinished_req`与`send_kv_chunk`之间的时序竞态如何导致去重后的槽位被错误释放，是理解PD架构中KV传输、Radix缓存和canary验证三者交互的绝佳案例。

bugfixtestkv-cache

#27427 Add GB300 base C CI suite

原始 PR · 作者 Fridge003 · 合并时间 2026-06-06 17:27

基础设施重要性 6.39 洞察度 5.00

在 CI 中添加 GB300 硬件测试套件并迁移 4-GPU 配置

值得精读，特别是 `test_numa_utils.py` 的重构模式和 `slash_command_handler.py` 中字段传递的设计。展示了如何在不入侵业务代码的前提下扩展 CI 硬件覆盖。对于需要新增 CI runner 的开发者有参考价值。

ciinfratest

#27285 [HiCache] Fix crash when using PP + HiCache L2

原始 PR · 作者 stepinto · 合并时间 2026-06-06 16:57

缺陷修复重要性 8.92 洞察度 6.00

修复PP+HiCache L2崩溃并引入pp_sync同步机制

值得精读，尤其是 `_pp_sync` 在调度器层面实现PP同步的设计模式。关注 `_reap_completed_async_work` 的异步管理技巧，以及 `writing_check` 中基于PP rank的条件处理。对于使用PP+HiCache的团队，建议及时合并。

bugfixhicachetest

#27428 [debug] Register #27338 EAGLE draft kv_indices revert in pr_fix_toggle

原始 PR · 作者 hnyls2002 · 合并时间 2026-06-06 15:30

其他重要性 5.00 洞察度 2.00

该 PR 变更简单明了，建议合并。对于关注 EAGLE speculative decoding 和 CUDA graph 稳定性的开发者，可了解该 revert 机制及其对应 PR #27338 的修复内容。

debuggingspeculative-decodinginfra

第 3 / 357 页 · 共 2850 条

上一页 1 2 3 4 5 … 357 下一页