Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 16:47 同步状态：空闲下次计划：2026-06-07 17:47

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-04-08

#22346 [CI] Set RUNAI_STREAMER_MEMORY_LIMIT=0 for stage-b-test-1-gpu-small

原始 PR · 作者 alexnails · 合并时间 2026-04-08 17:23

基础设施重要性 3.00 洞察度 2.00

为CI测试作业设置无限内存缓冲，解决模型加载超时问题。

该PR变更简单直接，无需精读。值得关注的是CI环境中流式加载器的内存缓冲调优模式，可作为类似性能问题的参考。对于基础设施团队，可了解如何通过环境变量优化大型模型加载测试。

run-citest

#22237 [CI] Relax gpt-oss 4GPU accuracy threshold from 0.60 to 0.58

原始 PR · 作者 alisonshao · 合并时间 2026-04-08 17:20

基础设施重要性 2.00 洞察度 3.00

降低GPT-OSS 4GPU测试的准确度阈值，减少CI误报。

该PR变更简单直接，无需深入精读。值得关注的是其基于数据的阈值调整方法：通过分析历史运行数据（40次调度运行）确定合理阈值，可作为类似测试稳定性优化的参考案例。

run-citest

#21035 fix: wrap _import_static_state in inference_mode to fix resume on Blackwell

原始 PR · 作者 fergusfinn · 合并时间 2026-04-08 17:03

缺陷修复重要性 5.83 洞察度 4.00

修复 Blackwell 上 resume 时因 inference_mode 导致的崩溃

值得快速合并的低风险 bugfix。对于维护者，可关注后续是否有其他涉及 inference tensor 的类似场景。

bugfix

#22185 [HiCache] Fix write_backup return type when parent not backed up

原始 PR · 作者 vladnosiv · 合并时间 2026-04-08 16:42

缺陷修复重要性 5.00 洞察度 4.00

修复HiCache备份方法返回类型不匹配导致的TypeError，确保写回模式下的父节点先备份约束。

该PR值得精读，重点关注：1. write_backup方法中write_back参数如何区分不同备份模式下的检查逻辑。2. evict方法中write_backup返回值的处理如何避免断言失败。这些设计决策体现了对缓存一致性约束的精细控制。

bugfixrun-cihicache

#22118 [Score API] Add SequenceClassification Model support

原始 PR · 作者 sundar24295s · 合并时间 2026-04-08 16:30

功能重要性 6.00 洞察度 6.00

为评分API添加序列分类模型支持，扩展多项目评分功能。

建议工程师精读此PR，重点关注`score_and_pool`函数的实现，了解如何动态处理分隔符以支持多项目评分，以及review中的性能优化技巧（如避免GPU-CPU同步）。设计决策值得学习，特别是分类模型与生成模型的分发机制，以及MIS的高效打包策略。

featureschedulingrun-ci

#22285 Add CI tests for GLM-5

原始 PR · 作者 Fridge003 · 合并时间 2026-04-08 16:05

测试重要性 4.00 洞察度 3.00

为GLM-5模型添加CI测试，扩展8-GPU测试套件。

建议工程师关注测试配置的合理性和阈值设置；PR值得略读以了解如何为大型模型添加CI测试，但无复杂设计决策需深入分析。

testrun-ciperformance

#21817 [diffusion] Make warmup image initialization rank-safe

原始 PR · 作者 IPostYellow · 合并时间 2026-04-08 15:51

缺陷修复重要性 6.00 洞察度 5.00

修复多进程 warmup 图像初始化并发问题，确保秩安全。

建议工程团队精读此 PR，以理解多模态生成中 warmup 机制的设计和分布式同步的实现。关注 _prepare_shared_warmup_image_path 方法中的广播逻辑和错误处理，这体现了多进程环境下的资源协调模式。

diffusionrun-cibugfix

#22262 [AMD] Fix DLPack Error in Aiter flydsl GEMM by Detaching MoE Gate Weight

原始 PR · 作者 bingxche · 合并时间 2026-04-08 14:42

缺陷修复重要性 4.00 洞察度 5.00

修复AMD平台MoE门控权重在DLPack导出时的BufferError，确保CUDA图捕获稳定。

该PR代码变更简单直接，但背后的DLPack与autograd交互问题值得关注。建议精读aiter_dsv3_router_gemm函数的调用上下文，理解MoE路由在AMD平台上的实现细节。同时可关注gemini-code-assist[bot]提出的hidden_states潜在风险，评估是否需要在其他类似函数中预防性处理。

amdbugfixrun-ci

第 283 / 358 页 · 共 2857 条

上一页 1 … 281 282 283 284 285 … 358 下一页