Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 11:28 同步状态：空闲下次计划：2026-06-07 12:28

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-05-29

#26648 [CI] Split PP tests into base and extra suites

原始 PR · 作者 ShangmingCai · 合并时间 2026-05-29 12:15

测试重要性 7.50 洞察度 4.00

拆分PP测试为基础和扩展两套

值得关注这类 CI 拆分模式，可作为 SGLang 项目中其他大型测试文件（如 attention 测试、multimodal 测试）拆分的参考。推荐阅读 `test/registered/pp/test_pp_single_node_extra.py` 的注册方式和类结构，了解如何将测试与 CI 阶段映射。

citestrefactor

#24654 [Bugfix] [DSA] [Hisparse] Broadcast TP Rank 0 Topk Indexes to other TPs

原始 PR · 作者 xz-keg · 合并时间 2026-05-29 12:14

缺陷修复重要性 6.68 洞察度 5.00

广播 TP rank 0 的 top-k 索引，修复 DSA/HiSparse 跨 TP 不一致

该 PR 是解决 DSA top-k 不确定性的重要临时补丁，对使用 HiSparse 或进行确定性推理的用户值得关注。设计上采用环境变量开关、兼容 CUDA 图捕获的做法值得学习。建议阅读 `dsa_indexer.py` 中的广播实现和性能分析部分。

bugfixattentionconsistency

#26654 rename unittest as unittests

原始 PR · 作者 ch-wan · 合并时间 2026-05-29 12:14

基础设施重要性 3.44 洞察度 1.00

重命名 attention 测试目录避免与 unittest 模块冲突

值得快速合并以恢复 CI 正常。该 PR 属于基础设施清理，技术细节简单，但有助于提升开发体验。评审者应确认没有硬编码旧路径的引用。

citestinfra

#26492 [diffusion] model: update to new model format

原始 PR · 作者 nv-dmajchrowski · 合并时间 2026-05-29 12:08

功能重要性 8.71 洞察度 6.00

更新 Cosmos3 至新 diffusers 格式，使用外部 guardrails 包

建议开发者和维护者重点阅读 `cosmos3_guardrails.py` 的重写思路和配置文件的映射设计。本 PR 展示了将自实现功能迁移到专用外部包的典型模式，以及如何在演进中保持与 upstream checkpoint 的一致。对于部署人员，需注意新增的 pip 依赖。

diffusionrefactorfeature

#26653 test: stabilize Gemma4 26B-A4B MTP GSM8K test with deterministic inference + tuned threshold

原始 PR · 作者 kpham-sgl · 合并时间 2026-05-29 11:58

缺陷修复重要性 4.71 洞察度 7.00

使 Gemma4 MTP 测试确定性运行并调整阈值

值得精读，可作为如何使用确定性推理和系统数据校准来稳定 CI 测试的范例。PR body 中的统计过程是一种值得团队推广的严谨方法。

bugfixtestspeculative-decoding

#26655 Fix TRTLLM MHA draft decode cache seqlens replay

原始 PR · 作者 merrymercy · 合并时间 2026-05-29 11:58

缺陷修复重要性 5.86 洞察度 3.00

修复 TRTLLM MHA draft decode 缓存序列长度重放

值得立即合并，修复了可能导致不正确推理结果的 bug。建议未来为该路径增加单元测试。

bugfixattentionblackwell

#25676 Upgrade xgrammar to 0.2.1

原始 PR · 作者 JustinTong0323 · 合并时间 2026-05-29 11:40

功能重要性 8.83 洞察度 7.00

升级 xgrammar 到 0.2.1，启用原生结构标签

值得精读。特别是 `deepseekv32_detector.py` 的删减方式和 `kimik2_detector.py` 中 `get_structural_tag` 的实现，展示了如何优雅地利用上游修复并处理兼容性问题。`serving_chat.py` 中的一行条件修改也体现了 reasoning 与 grammar 的职责分离设计。本 PR 是结构化标签功能演进的重要一步。

dependenciesdeepseekfeature

#26591 [AMD] Pin compressed-tensors<0.16.0 for srt_hip (fixes ROCm 7.2 nightly build)

原始 PR · 作者 yctseng0211 · 合并时间 2026-05-29 11:34

基础设施重要性 3.27 洞察度 3.00

AMD 依赖锁定修复 ROCm 7.2 构建

值得关注。虽然变更简单，但这是典型的依赖版本下界冲突导致上游破坏的案例，注释清楚说明了问题和临时锁定策略。AMD 平台维护者应关注后续 ROCm 基础镜像升级后移除该锁定。

amddependenciesinfra

第 51 / 357 页 · 共 2850 条

上一页 1 … 49 50 51 52 53 … 357 下一页