Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 10:11 同步状态：空闲下次计划：2026-06-07 11:11

后台正在同步并分析最近 PR，页面会自动刷新并逐步显示最新结果。

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-05-13

#24572 [AMD] Register 5 server-style 1-GPU tests for AMD PR CI

原始 PR · 作者 michaelzhang-ai · 合并时间 2026-05-13 13:45

测试重要性 4.10 洞察度 3.00

为AMD CI注册5个服务端1-GPU测试

值得合并。这是一次规范的CI测试注册实践：明确筛选条件、逐个验证、缩小范围。对于关注跨平台CI基础设施的读者，可以学习如何安全地将NVIDIA测试迁移到AMD平台。

amdtestci

#25120 [env] Make max KV chunk capacity configurable via `SGLANG_MAX_KV_CHUNK_CAPACITY`

原始 PR · 作者 kpham-sgl · 合并时间 2026-05-13 13:37

功能重要性 5.66 洞察度 4.00

KV chunk容量可环境变量配置

值得快速合并。作为将硬编码参数环境变量化的模板，未来可参考此模式将其他待定参数（如 SGLANG_CHUNKED_PREFIX_CACHE_THRESHOLD）也统一管理。建议后续补充单元测试以验证环境变量解析和边界值。

run-cikv-cachedeepseek

#25134 [Doc]: refactor Intern-S2-Preview cookbook with interactive command generator

原始 PR · 作者 zijiexia · 合并时间 2026-05-13 13:26

文档重要性 6.74 洞察度 2.00

重构 Intern-S2-Preview cookbook 并添加交互式命令生成器

建议文档维护者阅读此 PR，了解交互式命令生成器的实现方式，可用于后续其他 cookbook 页面的统一重构。值得注意的是组件采用了 MutationObserver 监听主题切换，确保亮暗主题下样式正确。

documentationrefactor

#25109 spec: defer verify() idle hidden_size to worker fixup

原始 PR · 作者 hnyls2002 · 合并时间 2026-05-13 13:13

重构重要性 5.62 洞察度 6.00

将idle时hidden_size计算延迟到worker fixup统一处理

值得精读，展示了如何通过延迟绑定（lazy binding）消除重复逻辑，是良好的架构清理范例。可关注 `hidden_size_for` 方法的设计。

refactorspeculative-decodingdeepseek

#25132 ci: extract check-changes into reusable workflow

原始 PR · 作者 hnyls2002 · 合并时间 2026-05-13 13:05

重构重要性 5.49 洞察度 2.00

将 check-changes CI job 提取为可复用 workflow

建议阅读此 PR 以了解 SGLang CI 库的重构方式，合并后可借鉴此模式提取其他重复 job。对 CI 运维领域有价值。

run-cirefactorinfra

#24874 Reject repetition_penalty=0 in SamplingParams.verify()

原始 PR · 作者 RulinJuice · 合并时间 2026-05-13 12:25

缺陷修复重要性 5.74 洞察度 4.00

拒绝 repetition_penalty=0 避免 GPU 崩溃

值得精读。这是一个典型的“输入验证防止内核崩溃”的 bugfix，展示了如何通过早期验证避免 GPU 级别的灾难性失败。设计决策值得在其他除法相关参数验证中复用。

bugfixrun-cidocumentation

#25115 [Doc]: add interns2preview in cookbook

原始 PR · 作者 RunningLeon · 合并时间 2026-05-13 12:06

文档重要性 4.55 洞察度 2.00

新增 Intern-S2-Preview 部署文档

对于需要部署 Intern-S2-Preview 模型的用户，建议精读此文档。文档中提供的 MTP 多 token 预测配置值得关注，展示了 SGLang 对新模型的高级特性支持。

documentationcookbookdeployment

#25022 [Bugfix, NSA HiCache] Fix missing override_kv_cache_dim in attach_hybrid_nsa_pool_to_hiradix_cache

原始 PR · 作者 taegeonum · 合并时间 2026-05-13 11:45

缺陷修复重要性 6.16 洞察度 5.00

修复 NSA HiCache 中缺失的 override_kv_cache_dim 参数

值得精读，展示如何从重构中引入细微 bug 并修复，同时进行接口清理。关注 `override_kv_cache_dim` 在共享锚点中的必要性，以及改为传递通信组对象的设计思路。

bugfixhicachekv-cache

第 137 / 357 页 · 共 2850 条

上一页 1 … 135 136 137 138 139 … 357 下一页