Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 16:47 同步状态:空闲 下次计划:2026-06-07 17:47

PR 列表

更多筛选
2026-04-08
基础设施 重要性 3.00 洞察度 2.00

为CI测试作业设置无限内存缓冲,解决模型加载超时问题。

该PR变更简单直接,无需精读。值得关注的是CI环境中流式加载器的内存缓冲调优模式,可作为类似性能问题的参考。对于基础设施团队,可了解如何通过环境变量优化大型模型加载测试。

基础设施 重要性 2.00 洞察度 3.00

降低GPT-OSS 4GPU测试的准确度阈值,减少CI误报。

该PR变更简单直接,无需深入精读。值得关注的是其基于数据的阈值调整方法:通过分析历史运行数据(40次调度运行)确定合理阈值,可作为类似测试稳定性优化的参考案例。

缺陷修复 重要性 5.00 洞察度 4.00

修复HiCache备份方法返回类型不匹配导致的TypeError,确保写回模式下的父节点先备份约束。

该PR值得精读,重点关注:1. write_backup方法中write_back参数如何区分不同备份模式下的检查逻辑。2. evict方法中write_backup返回值的处理如何避免断言失败。这些设计决策体现了对缓存一致性约束的精细控制。

功能 重要性 6.00 洞察度 6.00

为评分API添加序列分类模型支持,扩展多项目评分功能。

建议工程师精读此PR,重点关注`score_and_pool`函数的实现,了解如何动态处理分隔符以支持多项目评分,以及review中的性能优化技巧(如避免GPU-CPU同步)。设计决策值得学习,特别是分类模型与生成模型的分发机制,以及MIS的高效打包策略。

#22285 Add CI tests for GLM-5

原始 PR · 作者 Fridge003 · 合并时间 2026-04-08 16:05

测试 重要性 4.00 洞察度 3.00

为GLM-5模型添加CI测试,扩展8-GPU测试套件。

建议工程师关注测试配置的合理性和阈值设置;PR值得略读以了解如何为大型模型添加CI测试,但无复杂设计决策需深入分析。

缺陷修复 重要性 6.00 洞察度 5.00

修复多进程 warmup 图像初始化并发问题,确保秩安全。

建议工程团队精读此 PR,以理解多模态生成中 warmup 机制的设计和分布式同步的实现。关注 _prepare_shared_warmup_image_path 方法中的广播逻辑和错误处理,这体现了多进程环境下的资源协调模式。

缺陷修复 重要性 4.00 洞察度 5.00

修复AMD平台MoE门控权重在DLPack导出时的BufferError,确保CUDA图捕获稳定。

该PR代码变更简单直接,但背后的DLPack与autograd交互问题值得关注。建议精读aiter_dsv3_router_gemm函数的调用上下文,理解MoE路由在AMD平台上的实现细节。同时可关注gemini-code-assist[bot]提出的hidden_states潜在风险,评估是否需要在其他类似函数中预防性处理。

参与讨论