Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 12:34 同步状态：空闲下次计划：2026-06-07 13:34

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-03-23

#20343 HiSparse for Sparse Attention

原始 PR · 作者 xiezhq-hermann · 合并时间 2026-03-23 14:09

功能重要性 8.00 洞察度 7.00

引入 HiSparse 机制，通过 CPU 内存存储空闲 KV 缓存，提升稀疏注意力模型的批大小和吞吐量。

建议技术管理者和工程师精读此 PR，重点关注 `HiSparseCoordinator` 的设计决策和 CUDA 内核的优化技巧。值得学习的包括高效的 GPU-CPU 缓存交换机制和 JIT 内核集成模式。对于部署，需验证配置兼容性并考虑添加测试覆盖。

performancefeaturejit-kernel

#21182 [CI] Fix cutlass import error: restore nvidia-cutlass-dsl force-reinstall

原始 PR · 作者 alisonshao · 合并时间 2026-03-23 13:41

缺陷修复重要性 4.00 洞察度 2.00

修复 CI 中 cutlass 导入错误，恢复 nvidia-cutlass-dsl 强制重新安装。

这是一个简单的 CI bugfix，工程师可以快速浏览以了解 pip 依赖升级时的常见陷阱（如 .pth 文件问题），但无需深入分析。建议关注点在于 CI 脚本的依赖管理实践，但无重大设计决策值得精读。

bugfixcidebugging

#21116 Enable JIT clamp_position and resolve_future_token_ids on ROCm

原始 PR · 作者 merrymercy · 合并时间 2026-03-23 13:33

功能重要性 5.00 洞察度 4.00

启用ROCm上JIT内核支持，优化clamp_position和resolve_future_token_ids性能。

建议快速阅读以了解设备支持扩展的模式，特别是TensorMatcher设备选项的更新和Python入口点条件逻辑的简化设计；对于关注多平台支持的工程师，可注意未采纳的重命名建议，以改进代码可读性。

jit-kernelperformancefeature

#21139 [diffusion] Auto-skip diffusion tests when required pipeline class is missing from diffusers

原始 PR · 作者 yhyang201 · 合并时间 2026-03-23 12:15

基础设施重要性 4.00 洞察度 5.00

在diffusion测试中自动跳过缺少所需pipeline类的测试，提升CI稳定性。

该PR变更较小，工程师可快速浏览以理解CI优化逻辑，但无需深入分析代码细节。值得关注的是review中关于错误处理精确性的讨论，对于设计稳健的测试框架和异常处理机制有借鉴意义。

cidiffusionbugfix

#21178 Temporarily disable flaky qwen3 cp test in CI

原始 PR · 作者 ShangmingCai · 合并时间 2026-03-23 12:13

测试重要性 2.00 洞察度 2.00

临时禁用 CI 中不稳定的 Qwen3-30B 上下文并行测试。

该 PR 变更简单，主要用于 CI 维护，不值得精读；但如需了解 CI 测试禁用机制，可关注 `register_cuda_ci` 函数的用法。

cidebugging

#20039 [Bugfix] Work around FlashInfer unified transport issue on GB

原始 PR · 作者 mmangkad · 合并时间 2026-03-23 12:10

缺陷修复重要性 7.00 洞察度 5.00

临时修复 FlashInfer 统一传输在 GB 平台导致数据损坏的问题。

该 PR 值得精读，尤其关注上下文管理器设计和平台检测逻辑，展示了临时工作区的优雅实现方式。建议工程师学习其异常处理和环境集成的最佳实践，同时注意临时方案的移除时间点。

bugfixperformancerefactor

#21137 [SKILL] fix(bench): Support model-specific DenoisingStage variants in…

原始 PR · 作者 BBuf · 合并时间 2026-03-23 12:08

缺陷修复重要性 4.00 洞察度 3.00

扩展denoise latency解析逻辑以支持模型特定的DenoisingStage变体，提升benchmark兼容性。

该PR值得快速浏览以了解latency解析的灵活性改进。关注字符串匹配的设计决策，以及潜在的多匹配风险。

bugfixdiffusionperformance

#20625 [Bug Fix] Fix non-streaming request abort failure when --enable-metrics is enabled

原始 PR · 作者 fanghao566 · 合并时间 2026-03-23 10:58

缺陷修复重要性 6.00 洞察度 6.00

修复启用指标时非流式请求中止失效的bug，通过修补中间件保持ASGI receive传递。

推荐精读此PR，特别是`_PureASGIDispatch`的设计，以了解如何处理ASGI中间件的receive传递问题，并关注测试策略从集成到单元的演变，体现了优化测试效率的实践。

bugfix

第 351 / 357 页 · 共 2850 条

上一页 1 … 349 350 351 352 353 … 357 下一页