Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-14 13:18 同步状态：空闲下次计划：2026-06-14 14:18

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-03-28

#21123 [VLM] reduce CPU peak memory in multimodal tensor hashing

原始 PR · 作者 yhyang201 · 合并时间 2026-03-28 11:09

性能优化重要性 6.00 洞察度 6.00

通过零拷贝优化减少多模态张量哈希的CPU峰值内存，提升服务性能。

该PR值得精读，特别是关注零拷贝优化在PyTorch和NumPy中的实现技巧，以及如何通过增量哈希避免大内存分配。设计决策展示了性能与代码简洁性的权衡。

performancerefactortest

#21555 Update CODEOWNERS for transformers.py and docs

原始 PR · 作者 adarshxs · 合并时间 2026-03-28 11:07

基础设施重要性 2.00 洞察度 1.00

更新 CODEOWNERS 文件，为 transformers.py 添加代码所有者。

此 PR 变更简单，不值得深入技术精读，除非您关注代码所有权管理或需要了解 transformers.py 的维护责任。可快速浏览以确认变更符合团队规范。

documentationci

#20633 [diffusion] Remove redundant identity preprocess_text functions for sglang-diffusion

原始 PR · 作者 fengyuanyu1 · 合并时间 2026-03-28 10:07

重构重要性 4.00 洞察度 5.00

移除sglang-diffusion中冗余的identity预处理函数，使用None表示无需预处理。

建议工程师精读此PR以学习如何优雅地清理冗余代码和改进API设计，重点关注text_encoding.py中None处理的逻辑和类型定义的更新，可作为代码重构的参考案例。

diffusionrefactorci

#20706 [diffusion] Unify `TeaCacheParams` and `WanTeaCacheParams`

原始 PR · 作者 eitanturok · 合并时间 2026-03-28 09:51

重构重要性 6.00 洞察度 6.00

统一TeaCache参数类，移除Wan特定实现，支持动态系数回调。

建议工程师精读此PR，重点关注： - TeaCacheParams类的设计变化，特别是get_coefficients方法和coefficients_callback机制，展示了如何通过回调支持动态系数选择。 - CFG逻辑的简化处理（get_skip_boundaries方法），这对理解扩散模型中的缓存优化和步骤管理有参考价值。 - 单元测试的设计，验证兼容性和回调优先级，可作为类似重构的测试范例。

diffusionrefactorfeature

#21552 [diffusion] UX: aggregate expected dtype-cast logs during weight loading

原始 PR · 作者 mickqian · 合并时间 2026-03-28 09:50

重构重要性 4.00 洞察度 5.00

聚合扩散模型权重加载时的数据类型转换日志，减少噪音。

建议开发者关注聚合日志的设计模式，以及如何平衡详细度和简洁性。代码修改值得参考，特别是使用Counter和defaultdict进行统计。

diffusionrefactordebugging

#19452 [NVIDIA] Enable automatic NUMA configuration

原始 PR · 作者 trevor-m · 合并时间 2026-03-28 09:44

功能重要性 6.00 洞察度 6.00

启用自动NUMA节点配置，替代手动指定，提升系统性能。

建议工程师精读numa_utils.py以理解自动NUMA配置的核心逻辑，特别关注设计决策如查询方法选择。对于性能优化项目，此PR提供了系统配置自动化的范例。

featureperformancerefactor

#21575 docs: flesh out MAINTAINER.md oncall lists and link GitHub profiles

原始 PR · 作者 merrymercy · 合并时间 2026-03-28 08:39

文档重要性 4.00 洞察度 2.00

更新维护者文档，细化按领域分区的合并/评审人员列表并添加GitHub个人资料链接。

该PR值得团队负责人、文档维护者和CI管理员阅读，以了解维护者结构和权限变更。对于普通工程师，建议关注MAINTAINER.md中的oncall列表，熟悉新的协作流程，并检查CI_PERMISSIONS.json以确认权限更新。

documentationci

#21037 Scope streaming backlog coalescing to incremental_streaming_output mode

原始 PR · 作者 vladnosiv · 合并时间 2026-03-28 08:29

缺陷修复重要性 5.00 洞察度 5.00

限制流式积压合并仅适用于增量流输出模式，避免不必要的性能开销。

建议精读此PR，重点关注`_wait_one_response`函数中的条件判断和块合并逻辑，这展示了流式输出处理的核心设计权衡（如增量vs累积输出）。对工程师而言，可学习如何优化性能敏感路径，并注意日志策略的平衡。

bugfixperformancerefactor

第 372 / 398 页 · 共 3179 条

上一页 1 … 370 371 372 373 374 … 398 下一页