Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 10:11 同步状态：空闲下次计划：2026-06-07 11:11

后台正在同步并分析最近 PR，页面会自动刷新并逐步显示最新结果。

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-05-15

#25340 fix: strip "[asctime]" prefix when parsing JSON log lines in nightly tests

原始 PR · 作者 Kangyan-Zhou · 合并时间 2026-05-15 11:17

缺陷修复重要性 4.85 洞察度 3.00

修复因日志前缀变更导致的夜间测试失败

值得合入以修复 CI 稳定性；可精读解析逻辑的健壮性改进，这种 `find` + try/except 模式适合作为测试中解析带前缀日志的标准模式。

bugfixtestci

#25316 move dead sglang.test files to test/manual

原始 PR · 作者 hnyls2002 · 合并时间 2026-05-15 11:02

重构重要性 3.66 洞察度 2.00

将26个未使用的测试文件移至 test/manual 目录

该 PR 属于代码库清理，逻辑简单，无需深入审查。适合快速合并。若关注测试目录结构，可了解 `test/manual/` 的用途。

testrefactorinfra

#24906 Support Qwen3.5 NVFP4 MTP DeepEP

原始 PR · 作者 YAMY1234 · 合并时间 2026-05-15 10:49

功能重要性 6.89 洞察度 6.00

支持 Qwen3.5 NVFP4 MTP 与 DeepEP 低延迟模式

此 PR 涉及 DeepEP 低延迟模式与 MTP 的集成，以及 GPU 架构感知的 verify 内核选择，设计取舍值得关注。建议负责 DeepEP 和推测解码的工程师精读，特别是 `forward_unquantized_deepep_ll` 的 fallback 实现和 bf16_dispatch 的配置传播。

quantmoespeculative-decoding

#25265 [perf] fix kimi tokenizer to improve ttft

原始 PR · 作者 Qiaolin-Yu · 合并时间 2026-05-15 10:11

性能优化重要性 5.99 洞察度 5.00

优化 Kimi 等 tiktoken 衍生 tokenizer 的 TTFT

建议精读该 PR，尤其是其中条件分支的设计思路：通过检测 `is_fast` 属性，在慢速 tokenizer 上切换为 `.encode()` 循环，同时保留 fast tokenizer 的批量优化。这是一个典型的最小改动、最大收益的案例，值得在类似性能优化中参考。

performancescheduling

#25311 perf(mla): TMA bulk-store set_mla_kv_buffer (up to 12× over baseline)

原始 PR · 作者 ch-wan · 合并时间 2026-05-15 09:23

性能优化重要性 9.12 洞察度 7.00

优化 MLA KV 缓存写入，性能提升最高 12 倍

值得精读。该 PR 展示了 GPU 内核优化的完整工程实践：从瓶颈识别、多种实现方案对比、自动调度到测试和基准覆盖，并处理了 TMA 硬件特有的正确性细节。可学习其设计决策和阈值调优方法。

performancejit-kernelmla

#25329 Skip CI tests added in #24816 (broken on main)

原始 PR · 作者 ch-wan · 合并时间 2026-05-15 09:12

缺陷修复重要性 3.25 洞察度 2.00

临时跳过 CI 中断的测试

该 PR 是临时性 CI 维护变更，技术含量低。建议合并以保持 CI 绿色，但应尽快跟进根本原因修复。

bugfixciquant

#25326 chore: bump sgl-kernel version to 0.4.2.post2

原始 PR · 作者 sglang-bot · 合并时间 2026-05-15 08:53

基础设施重要性 4.13 洞察度 2.00

将 sgl-kernel 版本升至 0.4.2.post2

该 PR 为常规维护操作，无需深入审查。可快速合并。

dependenciessgl-kernelci

#24935 :memo: docs: add canonical URL to fix Google indexing lmsysorg.mintlify.app instead of docs.sglang.io

原始 PR · 作者 unseenmars · 合并时间 2026-05-15 07:46

文档重要性 3.18 洞察度 2.00

添加 canonical URL 修复 Google 索引

建议快速合并。该 PR 是典型的 SEO 修复，改动小且无副作用，能显著提升文档的可发现性。值得关注的点：如何通过配置层面的小改动解决多域名部署的 SEO 问题。

documentation

第 125 / 357 页 · 共 2850 条

上一页 1 … 123 124 125 126 127 … 357 下一页