Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 10:11 同步状态：空闲下次计划：2026-06-07 11:11

后台正在同步并分析最近 PR，页面会自动刷新并逐步显示最新结果。

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-05-26

#26148 Skip PP output communication for pure chunked prefill batches

原始 PR · 作者 xu-yfei · 合并时间 2026-05-26 21:59

性能优化重要性 7.75 洞察度 6.00

PP 中跳过纯 chunked prefill 批次的输出通信，释放 SM 资源提升性能

建议阅读：理解 pipeline parallelism 中 SM 占用对 kernel 延迟的影响及如何通过跳过无用通信优化。若部署 DeepSeek-V4 长输入场景（256K token），可启用该优化获得 3-7% TTFT 收益。代码实现简洁（+112 行），验证充分，值得参考。

performanceschedulinginfra

#26322 fix(ci): enforce legacy docs/ gate in Lint workflow

原始 PR · 作者 zijiexia · 合并时间 2026-05-26 20:06

基础设施重要性 4.29 洞察度 3.00

修复 CI 中 legacy docs/ 变更检测失效问题

该 PR 属于基础设施加固，值得关注其通过三路 diff 替代 `--cached` 的思路，以及显式 diff 失败处理的模式。对于贡献者而言，应了解 `docs/` 目录的新校验规则。

ciinfradocumentation

#26358 Revert "[perf][spec decoding] Skip full-vocab softmax in EAGLE draft when topk == 1 (#26235)"

原始 PR · 作者 michaelzhang-ai · 合并时间 2026-05-26 17:47

其他重要性 6.76 洞察度 6.00

回退 EAGLE topk==1 跳过 softmax 优化

该 PR 是紧急修复回退，建议所有使用 EAGLE + MTP 的部署立即合入。对于仅使用标准 EAGLE 且关注性能的团队，可关注后续优化的重新提交通常采用 `topk==1 AND not is_mtp_path` 的 guard 或数学恒等式 softmax 优化。PR 的讨论和 PR Body 中的根因分析方法值得精读，展示了精确的跨运行对比和手动验证流程。

bugfixspeculative-decodingdeepseek

#26271 Extract Scheduler init methods and add skills to enforce the splitting requirements

原始 PR · 作者 fzyzcjy · 合并时间 2026-05-26 17:45

重构重要性 6.86 洞察度 6.00

提取 Scheduler.__init__ 中 13 个组件构造为独立 init_* 方法

值得精读，尤其是提取策略和字节等价验证方法。展示了如何在不影响行为的前提下提升可定制性，并配备 Agent 技能文档以自动化约束。review 中关于 `None` 初始化的未采纳建议值得后续跟进。

refactordocumentationscheduling

#26301 [HiCache]: Check return code of cudaHostRegister

原始 PR · 作者 stepinto · 合并时间 2026-05-26 17:44

缺陷修复重要性 5.00 洞察度 3.00

检查 cudaHostRegister 返回值，失败时抛出异常

该 PR 小而精，值得精读作为一个良好实践：在系统编程中始终检查 CUDA API 的返回码。可直接合并，无需额外关注。

bugfixhicacheinfra

#26392 [AMD] Relaxing timeout for AMD CI

原始 PR · 作者 yctseng0211 · 合并时间 2026-05-26 17:25

基础设施重要性 3.29 洞察度 2.00

放宽 AMD CI 超时限制

建议快速合入。该 PR 是纯运维调整，无代码风险，能有效缓解 AMD CI 的超时问题。后续可考虑优化测试速度或采用更智能的超时策略。

amdinfraci

#15829 [feat] Support `extra_buffer` in Mamba2-based models

原始 PR · 作者 roikoren755 · 合并时间 2026-05-26 16:03

功能重要性 8.31 洞察度 6.00

为 Mamba2 模型支持 extra_buffer 调度策略

该 PR 展示了如何将 extra_buffer 策略从 FLA 扩展到 Mamba2，其 chunk size 统一思路值得借鉴。但由于合并后出现回归，建议暂停部署，待作者修复后重新 review。阅读此 PR 可重点关注 `_init_track_ssm_indices` 中的索引映射逻辑和 `mamba_cache_chunk_size` 的动态计算过程。

featureschedulingkv-cache

#26379 Revert "fix(tool_call): normalize non-standard JSON Schema types in tool params"

原始 PR · 作者 hnyls2002 · 合并时间 2026-05-26 15:49

其他重要性 8.06 洞察度 2.00

回退工具参数 JSON Schema 类型规范化功能

该 PR 为紧急回退，变更简单明确，无需精读。但建议关注后续对原功能的重新实现，特别是增加充足的测试覆盖以避免 CI 问题。

bugfixtestci

第 67 / 357 页 · 共 2850 条

上一页 1 … 65 66 67 68 69 … 357 下一页