Prhub
← 返回仓库列表

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-04-19 14:39 同步状态:空闲 下次计划:2026-04-19 15:39

PR 列表

已合并 960 · 已分析 960
更多筛选
2026-04-11

#22571 Remove redundant test_page_size.py

作者 hnyls2002 · 合并时间 2026-04-11 11:35

重构 重要性 2.00 洞察度 2.00

删除冗余的页面大小测试文件,其功能已被更全面的EAGLE测试覆盖。

该PR变更简单,无需深入精读。对于团队来说,值得关注的是测试覆盖的优化策略,即识别并删除冗余测试以提升CI效率。建议在类似清理操作中确保有明确的覆盖验证(如PR body中的测试计划),以避免意外丢失测试场景。

#22368 [VLM] GPU Image Preprocessing for Kimi-K2.5

作者 yhyang201 · 合并时间 2026-04-11 11:13

性能优化 重要性 6.00 洞察度 6.00

启用GPU图像预处理,显著降低Kimi-K2.5模型的首次令牌生成时间。

建议工程师精读kimi_k25.py中的GPU处理函数(如navit_resize_config和_process_single_image),学习图像预处理的GPU加速设计;关注review中讨论的冗余检查和内存管理问题,以改进代码质量。

缺陷修复 重要性 5.00 洞察度 4.00

修复CUDA Graph捕获时num_token_non_padded计算逻辑,确保捕获与重放行为一致。

建议CUDA Graph和attention TP相关开发者精读此PR,理解捕获与重放路径对齐的设计决策。关注条件判断逻辑和compute_local_num_token_non_padded函数的实现,确保在不同配置下行为正确。

基础设施 重要性 6.00 洞察度 6.00

改进扩散模型CI测试可读性并修复早期返回bug。

建议技术管理者和工程师精读run_suite.py的重试机制设计,理解如何平衡测试稳定性和准确性,并关注对早期返回bug的修复以避免类似问题。同时,review讨论中的OOM检测改进值得后续跟踪。

#22570 [misc] update CI_PERMISSIONS.json

作者 Qiaolin-Yu · 合并时间 2026-04-11 09:58

基础设施 重要性 2.00 洞察度 1.00

为用户lawrence-harmonic添加CI权限配置,允许其触发CI测试和重试失败任务。

该PR变更简单直接,无需深入阅读。对于了解CI权限管理机制的工程师,可快速浏览以熟悉配置格式;对于其他人员,可忽略。

#22264 [AMD] Upgrade Aiter v0.1.12.post1

作者 bingxche · 合并时间 2026-04-11 09:40

基础设施 重要性 4.00 洞察度 3.00

升级AMD平台Aiter依赖至v0.1.12.post1并移除硬编码安装

该PR变更直接,建议快速浏览以了解AMD平台依赖管理更新。值得关注的设计决策是移除硬编码依赖转向标准requirements.txt管理,这体现了依赖管理的规范化趋势。对于使用AMD平台的开发者,需要确认新版本Aiter的稳定性。

#22565 chore: update CI test est_time values

作者 sglang-bot · 合并时间 2026-04-11 09:15

基础设施 重要性 4.00 洞察度 2.00

自动化更新250个CI测试文件的估计时间值,优化负载均衡算法准确性。

该PR无需精读,除非您负责CI基础设施、测试调度优化或关注自动化流程。可快速浏览以了解est_time更新机制,但无重要设计决策需深入分析。

缺陷修复 重要性 3.00 洞察度 4.00

修复CI测试时间估算脚本,按后端硬件区分时间统计,避免跨后端数据污染。

该PR虽小但展示了CI基础设施中一个重要的数据隔离问题。建议精读以理解:1) 如何通过数据结构设计避免数据污染;2) 正则表达式在配置更新中的精确匹配技巧。对于负责CI维护的工程师,这是值得参考的修复模式。

参与讨论