Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 11:28 同步状态:空闲 下次计划:2026-06-07 12:28

PR 列表

更多筛选
2026-05-29
测试 重要性 7.50 洞察度 4.00

拆分PP测试为基础和扩展两套

值得关注这类 CI 拆分模式,可作为 SGLang 项目中其他大型测试文件(如 attention 测试、multimodal 测试)拆分的参考。推荐阅读 `test/registered/pp/test_pp_single_node_extra.py` 的注册方式和类结构,了解如何将测试与 CI 阶段映射。

缺陷修复 重要性 6.68 洞察度 5.00

广播 TP rank 0 的 top-k 索引,修复 DSA/HiSparse 跨 TP 不一致

该 PR 是解决 DSA top-k 不确定性的重要临时补丁,对使用 HiSparse 或进行确定性推理的用户值得关注。设计上采用环境变量开关、兼容 CUDA 图捕获的做法值得学习。建议阅读 `dsa_indexer.py` 中的广播实现和性能分析部分。

#26654 rename unittest as unittests

原始 PR · 作者 ch-wan · 合并时间 2026-05-29 12:14

基础设施 重要性 3.44 洞察度 1.00

重命名 attention 测试目录避免与 unittest 模块冲突

值得快速合并以恢复 CI 正常。该 PR 属于基础设施清理,技术细节简单,但有助于提升开发体验。评审者应确认没有硬编码旧路径的引用。

功能 重要性 8.71 洞察度 6.00

更新 Cosmos3 至新 diffusers 格式,使用外部 guardrails 包

建议开发者和维护者重点阅读 `cosmos3_guardrails.py` 的重写思路和配置文件的映射设计。本 PR 展示了将自实现功能迁移到专用外部包的典型模式,以及如何在演进中保持与 upstream checkpoint 的一致。对于部署人员,需注意新增的 pip 依赖。

缺陷修复 重要性 5.86 洞察度 3.00

修复 TRTLLM MHA draft decode 缓存序列长度重放

值得立即合并,修复了可能导致不正确推理结果的 bug。建议未来为该路径增加单元测试。

#25676 Upgrade xgrammar to 0.2.1

原始 PR · 作者 JustinTong0323 · 合并时间 2026-05-29 11:40

功能 重要性 8.83 洞察度 7.00

升级 xgrammar 到 0.2.1,启用原生结构标签

值得精读。特别是 `deepseekv32_detector.py` 的删减方式和 `kimik2_detector.py` 中 `get_structural_tag` 的实现,展示了如何优雅地利用上游修复并处理兼容性问题。`serving_chat.py` 中的一行条件修改也体现了 reasoning 与 grammar 的职责分离设计。本 PR 是结构化标签功能演进的重要一步。

基础设施 重要性 3.27 洞察度 3.00

AMD 依赖锁定修复 ROCm 7.2 构建

值得关注。虽然变更简单,但这是典型的依赖版本下界冲突导致上游破坏的案例,注释清楚说明了问题和临时锁定策略。AMD 平台维护者应关注后续 ROCm 基础镜像升级后移除该锁定。

参与讨论