Prhub
← 返回仓库列表

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-04-20 00:19 同步状态:空闲 下次计划:2026-04-20 01:19

PR 列表

已合并 963 · 已分析 963
更多筛选
2026-04-08

#22270 Refactor auto benchmark unit tests and fix CI bug

作者 BBuf · 合并时间 2026-04-08 21:54

重构 重要性 4.00 洞察度 3.00

重构自动基准测试单元测试至模块化目录,修复 CI bug 并重新启用测试覆盖。

建议负责测试基础设施或自动基准测试的工程师精读此 PR,了解新的测试组织结构和共享辅助函数的设计。重点关注 `AutoBenchmarkTestCase` 基类的使用方式,以及如何通过模块化拆分提升可维护性;同时,留意避免路径硬编码的最佳实践,以优化 CI 环境中的测试执行。

#22266 [NPU] fix qwen3.5 video processor

作者 zhaozx-cn · 合并时间 2026-04-08 21:13

缺陷修复 重要性 6.00 洞察度 6.00

修复 NPU 上 Qwen3.5 视频处理器因超过8维 permute 导致的执行失败。

建议 NPU 开发者和多模态功能维护者仔细阅读此 PR,重点关注维度处理逻辑和 review 中的修正点,以学习硬件适配策略和代码重构模式。对于涉及视频预处理或 NPU 优化的工程师,此 PR 提供了有价值的参考。

基础设施 重要性 3.00 洞察度 2.00

为CI测试作业设置无限内存缓冲,解决模型加载超时问题。

该PR变更简单直接,无需精读。值得关注的是CI环境中流式加载器的内存缓冲调优模式,可作为类似性能问题的参考。对于基础设施团队,可了解如何通过环境变量优化大型模型加载测试。

基础设施 重要性 2.00 洞察度 3.00

降低GPT-OSS 4GPU测试的准确度阈值,减少CI误报。

该PR变更简单直接,无需深入精读。值得关注的是其基于数据的阈值调整方法:通过分析历史运行数据(40次调度运行)确定合理阈值,可作为类似测试稳定性优化的参考案例。

缺陷修复 重要性 5.00 洞察度 4.00

修复Blackwell GPU上恢复内存占用时因推理模式张量导致的运行时错误。

该PR值得精读,尤其是对于处理PyTorch推理模式与缓冲区管理交互的工程师。关注点:1)理解torch.inference_mode()对张量类型和原地操作的影响;2)学习如何通过环境一致性解决硬件特定的运行时错误;3)注意Blackwell GPU上triton attention backend可能引入的隐式类型转换。

缺陷修复 重要性 5.00 洞察度 4.00

修复HiCache备份方法返回类型不匹配导致的TypeError,确保写回模式下的父节点先备份约束。

该PR值得精读,重点关注:1. write_backup方法中write_back参数如何区分不同备份模式下的检查逻辑。2. evict方法中write_backup返回值的处理如何避免断言失败。这些设计决策体现了对缓存一致性约束的精细控制。

功能 重要性 6.00 洞察度 6.00

为评分API添加序列分类模型支持,扩展多项目评分功能。

建议工程师精读此PR,重点关注`score_and_pool`函数的实现,了解如何动态处理分隔符以支持多项目评分,以及review中的性能优化技巧(如避免GPU-CPU同步)。设计决策值得学习,特别是分类模型与生成模型的分发机制,以及MIS的高效打包策略。

#22285 Add CI tests for GLM-5

作者 Fridge003 · 合并时间 2026-04-08 16:05

测试 重要性 4.00 洞察度 3.00

为GLM-5模型添加CI测试,扩展8-GPU测试套件。

建议工程师关注测试配置的合理性和阈值设置;PR值得略读以了解如何为大型模型添加CI测试,但无复杂设计决策需深入分析。

参与讨论