Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 22:09 同步状态：空闲下次计划：2026-06-07 23:09

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-03-28

#21552 [diffusion] UX: aggregate expected dtype-cast logs during weight loading

原始 PR · 作者 mickqian · 合并时间 2026-03-28 09:50

重构重要性 4.00 洞察度 5.00

聚合扩散模型权重加载时的数据类型转换日志，减少噪音。

建议开发者关注聚合日志的设计模式，以及如何平衡详细度和简洁性。代码修改值得参考，特别是使用Counter和defaultdict进行统计。

diffusionrefactordebugging

#19452 [NVIDIA] Enable automatic NUMA configuration

原始 PR · 作者 trevor-m · 合并时间 2026-03-28 09:44

功能重要性 6.00 洞察度 6.00

启用自动NUMA节点配置，替代手动指定，提升系统性能。

建议工程师精读numa_utils.py以理解自动NUMA配置的核心逻辑，特别关注设计决策如查询方法选择。对于性能优化项目，此PR提供了系统配置自动化的范例。

featureperformancerefactor

#21575 docs: flesh out MAINTAINER.md oncall lists and link GitHub profiles

原始 PR · 作者 merrymercy · 合并时间 2026-03-28 08:39

文档重要性 4.00 洞察度 2.00

更新维护者文档，细化按领域分区的合并/评审人员列表并添加GitHub个人资料链接。

该PR值得团队负责人、文档维护者和CI管理员阅读，以了解维护者结构和权限变更。对于普通工程师，建议关注MAINTAINER.md中的oncall列表，熟悉新的协作流程，并检查CI_PERMISSIONS.json以确认权限更新。

documentationci

#21037 Scope streaming backlog coalescing to incremental_streaming_output mode

原始 PR · 作者 vladnosiv · 合并时间 2026-03-28 08:29

缺陷修复重要性 5.00 洞察度 5.00

限制流式积压合并仅适用于增量流输出模式，避免不必要的性能开销。

建议精读此PR，重点关注`_wait_one_response`函数中的条件判断和块合并逻辑，这展示了流式输出处理的核心设计权衡（如增量vs累积输出）。对工程师而言，可学习如何优化性能敏感路径，并注意日志策略的平衡。

bugfixperformancerefactor

#20972 Remove sync when enabling return_logprob

原始 PR · 作者 Qiaolin-Yu · 合并时间 2026-03-28 07:36

性能优化重要性 6.00 洞察度 5.00

移除启用return_logprob时的同步操作，提升约25.8%的token吞吐量。

建议工程师精读此PR，关注异步数据处理的设计模式，以及如何平衡性能与正确性，对于涉及GPU-CPU数据传输的优化有参考价值。

performancerefactorscheduling

#20232 [fix] qwen3.5 fuse_moe_triton_tune bug

原始 PR · 作者 zhangxiaolei123456 · 合并时间 2026-03-28 07:23

缺陷修复重要性 4.00 洞察度 2.00

修复 Qwen3.5 在 fused MoE Triton tuning 中的架构解析错误。

对于关注 fused MoE 优化或 Qwen 模型支持的开发者，此 PR 值得快速浏览以了解配置处理细节；对于一般用户，无需深入阅读。

bugfixtestperformance

#21439 [1/n] lora support - Auto detect lora target modules

原始 PR · 作者 yushengsu-thu · 合并时间 2026-03-28 07:08

功能重要性 6.00 洞察度 6.00

支持自动检测LoRA目标模块，简化适配器配置。

建议工程团队关注自动检测逻辑的设计，了解如何扩展支持新模块类型；测试部分的安全问题需后续修复；可精读utils.py中的auto_detect_lora_target_modules函数，学习模型扫描和模块归一化方法。

lorafeaturetest

#17255 fix tp capture in vit cuda graph

原始 PR · 作者 narutolhy · 合并时间 2026-03-28 06:38

缺陷修复重要性 6.00 洞察度 4.00

修复 ViT CUDA Graph 在 Tensor Parallelism 下通信捕获缺失的问题，提升正确性。

该 PR 值得精读，尤其关注 CUDA Graph 与分布式通信集成的设计模式，以及代码风格权衡；工程师可从中学习如何优雅处理可选功能集成。

bugfixcitest

第 333 / 358 页 · 共 2863 条

上一页 1 … 331 332 333 334 335 … 358 下一页