Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 12:34 同步状态：空闲下次计划：2026-06-07 13:34

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-04-29

#23646 [MUSA][Diffusion] Fix fa3 API on MT MUSA

原始 PR · 作者 wenqf11 · 合并时间 2026-04-29 04:01

缺陷修复重要性 6.57 洞察度 4.00

修复 MUSA 设备上 Flash Attention v3 的支持与 API 调用

值得精读，尤其对关注多硬件支持（Moore Threads）的开发者。展示如何将 CUDA 专有函数扩展至其他 GPU 架构，以及关键字参数调用的最佳实践。

jit-kernelbugfixmthreads

#23916 chore(codeowners): add @kpham-sgl as owner for gemma4 files

原始 PR · 作者 kpham-sgl · 合并时间 2026-04-29 02:43

其他重要性 2.60 洞察度 1.00

为 Gemma4 模型文件添加代码所有者

无需深入阅读。这是一个常规的 CODEOWNERS 维护变更，对理解系统架构无帮助。

run-ci

#23753 tokenizer: Add fastokens support

原始 PR · 作者 AlonKejzman · 合并时间 2026-04-29 02:43

功能重要性 7.79 洞察度 6.00

新增 fastokens tokenizer 后端，加速 TTFT

该 PR 设计清晰，值得精读。关键看点是：①如何通过 monkey-patch 无缝替换 tokenizer 后端；②如何在保证现有路径不变的前提下引入可选高速路径。对于希望了解 SGLang tokenizer 抽象层的开发者来说，这是很好的学习材料。

featureperformancedependencies

#23907 [Docs] add Nemotron 3 Nano Omni cookbook

原始 PR · 作者 zijiexia · 合并时间 2026-04-29 01:24

文档重要性 7.23 洞察度 2.00

新增 Nemotron 3 Nano Omni 部署 cookbook

建议合并，同时鼓励 reviewer 验证 snippet 生成的命令是否准确，并检查文档中 API 用例的兼容性。对于希望了解 SGLang 文档架构的开发者，此 PR 是学习 snippet 与 cookbook 协作模式的好例子。

documentationfeaturemultimodal

#23945 docs: enable MiMo V2.5 MTP cookbook path

原始 PR · 作者 JustinTong0323 · 合并时间 2026-04-29 01:22

功能重要性 5.31 洞察度 4.00

为 MiMo-V2.5 base 启用 EAGLE MTP 文档与代码片段

值得快速阅读。本 PR 展示了如何在文档层面为新变体启用已存在的功能，以及如何修正参数名并同步基准数据。Code Snippet 中的条件移除和逻辑统一是典型的小重构，对入门者理解前端配置驱动的范式有参考价值。另外 review 中关于 benchmark 数据有效性检查的提醒值得团队注意。

featuredocumentationspeculative-decoding

#23947 [Docs] add cookbook for Ling-2.6 family

原始 PR · 作者 JustinTong0323 · 合并时间 2026-04-29 00:42

文档重要性 8.44 洞察度 5.00

新增Ling-2.6 cookbook与交互部署选择器

建议阅读此PR以了解如何在SGLang文档中添加新模型cookbook，特别是thinking模式的文档处理和parser兼容性说明。也值得关注review中提出的import问题，确保后续文档PR都包含正确的React import。对于未使用的hardware选择器，应在后续PR中完善。

documentationfeaturemoe

2026-04-28

#23944 [AMD] Fix CI test_diffusion_generation[flux_2_image_t2i_2_gpus]

原始 PR · 作者 yichiche · 合并时间 2026-04-28 23:06

基础设施重要性 2.60 洞察度 2.00

AMD CI 超时提升至 150 分钟

简单直接的 CI 修复，无需精读。但值得注意：团队应评估是否需要在 AMD 工作流中增加模型缓存或预下载步骤，从根本上解决下载慢的问题，而不仅仅是扩大超时。

amdrun-cici

#23943 [Docs] Add single-node H200 DeepSeek-V4-Pro low-latency recipe

原始 PR · 作者 yhyang201 · 合并时间 2026-04-28 23:03

文档重要性 5.66 洞察度 3.00

新增 H200 单节点 DeepSeek-V4-Pro 低延迟部署方案

对于文档维护者，建议：1) 核实并修正模型路径以确保 H200 兼容性；2) 考虑提取验证逻辑为辅助函数避免重复。对于普通读者，此 PR 属于纯文档增强，无需深入代码细节，但可参考其中的参数组合了解 H200 上 DeepSeek-V4-Pro 的典型低延迟配置。

deepseekdocumentationfeature

第 200 / 357 页 · 共 2850 条

上一页 1 … 198 199 200 201 202 … 357 下一页