Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 10:11 同步状态：空闲下次计划：2026-06-07 11:11

后台正在同步并分析最近 PR，页面会自动刷新并逐步显示最新结果。

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-06-01

#26883 [PP][Bugfix] Handle input_ids assignment in prepare_for_extend

原始 PR · 作者 ShangmingCai · 合并时间 2026-06-01 14:43

缺陷修复重要性 5.66 洞察度 3.00

修复 PP profiler 中 deferred H2D 后 input_ids 未赋值

值得合入，修复明确，逻辑可读且无副作用。建议验证 PP profiling 端到端测试通过。

bugfixppscheduling

#26863 Fix weights_checker checksum for 0-dim tensors and multi-GPU

原始 PR · 作者 merrymercy · 合并时间 2026-06-01 12:27

缺陷修复重要性 7.73 洞察度 5.00

修复权重检查器零维张量与多GPU支持

建议团队成员特别是部署运维人员阅读此 PR，了解 weights_checker 的新用法和潜在风险。对于分布式调试非常有用。关注 review 中提出的 deadlock 问题，确保实际部署环境中的进程模型匹配。

bugfixfeaturemultimodal

#26530 [diffusion] CI: Infer diffusion test sampling params from task type

原始 PR · 作者 mickqian · 合并时间 2026-06-01 11:57

功能重要性 6.51 洞察度 5.00

扩散测试采样参数自动推断，移除冗余参数

建议扩散测试相关开发者精读 `testcase_configs.py` 中的新增函数，理解推断逻辑。该 PR 的设计模式（通过 task type 自动选择参数模板）值得在其他类似需要多配置的测试场景中复制。同时注意后续新增模型时检查推断映射是否覆盖。

diffusiontestrefactor

#26862 Add random-ids dataset, round-robin expert simulation, and kill_process_tree logging

原始 PR · 作者 merrymercy · 合并时间 2026-06-01 11:50

功能重要性 6.66 洞察度 5.00

添加 random-ids 数据集和轮询专家模拟

值得关注，尤其是 MoE 基准测试流程的设计思路和确定性模拟的实现。

featureperformancemoe

#24000 [tokenizer] Surface scheduler load info (num_running_reqs / num_waiting_reqs) in meta_info

原始 PR · 作者 brucechanglongxu · 合并时间 2026-06-01 11:45

功能重要性 5.64 洞察度 5.00

在 meta_info 中暴露调度器负载信息

值得合入。这个小而清晰的变更充分利用了已有数据通道，消除了冗余的负载轮询。推荐阅读 `_handle_batch_output` 方法以理解数据流路径。

featureobservabilityscheduling

#26714 fix test cases failed in nightly pipeline

原始 PR · 作者 liuxianglong17 · 合并时间 2026-06-01 11:33

缺陷修复重要性 4.86 洞察度 3.00

修复 NPU 夜间测试因超时失败

值得快速合入，属于典型的 CI 稳定性修复。关注其中 RPC 套接字关闭模式（`linger=0` + `getattr` 保护），可作为其他 `shutdown` 场景的参考模式。

bugfixnputest

#26824 [attn backend] Make spec_v2 seq_lens_cpu optional in trtllm_mla backend

原始 PR · 作者 Qiaolin-Yu · 合并时间 2026-06-01 11:29

重构重要性 6.59 洞察度 5.00

使 spec_v2 中 mla 的 seq_lens_cpu 可选以消除 D2H 同步

该 PR 值得精读，因为它展示了如何通过简单的标志位避免不必要的同步，以提高推测解码性能。设计上的权衡——用预分配的掩码缓冲区换取跳过同步——是典型的 GPU 编程优化模式。建议关注其与上层框架（如 `decide_needs_cpu_seq_lens`）的集成点。

performancerefactorattention

#26481 Fixed incorrect indexing for slot 0 compatibility

原始 PR · 作者 ck-intel · 合并时间 2026-06-01 10:46

缺陷修复重要性 4.61 洞察度 3.00

修复 bench_one_batch.py slot 0 索引错位

建议快速合并，修复明确且验证充分（PR body 附有测试命令）。

bugfixintelscheduling

第 38 / 357 页 · 共 2850 条

上一页 1 … 36 37 38 39 40 … 357 下一页