Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-14 14:25 同步状态：空闲下次计划：2026-06-14 15:25

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-03-28

#21465 [VLM] Optimize ShmPointerMMData for multi-pickle safety and deferred unwrap

原始 PR · 作者 yhyang201 · 合并时间 2026-03-28 23:11

性能优化重要性 7.39 洞察度 6.00

优化共享内存指针类以支持多次pickle并推迟解包，显著降低多图像VLM推理的TTFT。

建议技术管理者和工程师精读此PR，重点关注 `ShmPointerMMData` 类的设计权衡，如序列化简化、内存管理策略（延迟解包与显式materialize），以及调度器中解包时机调整对分布式通信的优化效果，这些决策对高性能推理系统具有借鉴价值。

multimodalperformancerun-ci

#21600 [diffusion] feat: support overlay model materialization

原始 PR · 作者 mickqian · 合并时间 2026-03-28 23:02

功能重要性 6.00 洞察度 6.00

为 SGLang 添加覆盖层模型支持，扩展非 diffusers 扩散模型的加载能力。

建议工程师精读 model_overlay.py 以理解覆盖层解析的核心设计，关注 maybe_resolve_overlay_model_path 函数的实现，这涉及模型路径解析和缓存策略。

diffusionfeaturedocumentation

#21608 [CI] hot-fix ci lint

原始 PR · 作者 yuan-luo · 合并时间 2026-03-28 21:32

缺陷修复重要性 3.00 洞察度 2.00

修复由 PR 21534 引入的 CI lint 失败，将 AccuracyTestParams 格式化为单行以通过 pre-commit 钩子。

该 PR 不值得精读，变更简单机械。关注点在于 CI 流程中的格式化工具交互和团队对代码风格的权衡决策。

citestbugfix

#21407 [FIX] Flux2-Klein prompt tokenization length to 512 and add regression coverage

原始 PR · 作者 adityavaid · 合并时间 2026-03-28 17:28

缺陷修复重要性 6.00 洞察度 5.00

修复 Flux2-Klein 模型提示词标记化长度从 77 改为 512，并添加回归测试。

推荐精读以了解如何修复配置继承导致的 bug。关注 tokenize_prompt 方法中硬编码 max_length 的决策，以及如何通过添加 text_encoder_extra_args 字段避免类似问题，对扩散模型开发有参考价值。

bugfixdiffusiontest

#21536 [Clean] Remove deprecated environs

原始 PR · 作者 Fridge003 · 合并时间 2026-03-28 15:35

重构重要性 3.00 洞察度 3.00

移除已弃用的FP8/FP4 GEMM环境变量，使用CLI标志替代配置。

对于技术管理者和工程师，建议关注向后兼容性迁移，确保用户文档已更新。该PR值得简要阅读以了解清理策略和配置演进方向，但无需深入分析复杂代码逻辑。

documentationrefactor

#21534 [AMD] Add GLM-4.7-FP8 accuracy CI test for MI35x

原始 PR · 作者 Jacob0226 · 合并时间 2026-03-28 15:28

测试重要性 4.00 洞察度 3.00

为 AMD MI35x 添加 GLM-4.7-FP8 GSM8K 精度测试的 CI 任务。

建议对 AMD 测试套件或模型精度验证感兴趣的工程师精读此 PR，关注测试配置、CI 集成方式以及 review 中的设计讨论。

citest

#21585 [CI] Move v32 cp test to deepep running suite

原始 PR · 作者 Fridge003 · 合并时间 2026-03-28 13:49

基础设施重要性 2.00 洞察度 1.00

将 DeepSeek V32 CP 单节点测试移动到 deepEP CI 运行套件，优化测试执行环境。

此 PR 变更简单，无需深度精读。建议工程团队关注 CI 套件配置的调整，并定期检查测试稳定性。对于 CI 维护者，可参考此变更了解 deepEP 套件的使用情况。

cideepseektest

#21586 Patch transformers is_base_mistral in CI to avoid HF 429 rate limiting

原始 PR · 作者 hnyls2002 · 合并时间 2026-03-28 13:19

基础设施重要性 4.00 洞察度 3.00

在CI中猴子补丁transformers的is_base_mistral函数以避免HuggingFace API速率限制，解决测试失败。

建议快速浏览此PR，了解如何通过猴子补丁避免外部API速率限制问题，特别是处理transformers依赖时的版本控制和环境隔离策略。

cibugfix

第 371 / 398 页 · 共 3182 条

上一页 1 … 369 370 371 372 373 … 398 下一页