Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 13:37 同步状态：空闲下次计划：2026-06-07 14:37

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-04-22

#22802 [diffusion] [AMD] model: allow AITER backends in Flux 2 pipeline

原始 PR · 作者 avjves · 合并时间 2026-04-22 23:15

功能重要性 5.53 洞察度 6.00

为 Flux 2 扩散模型添加 AMD 设备专用的 AITER 注意力后端支持，修复性能回归。

该 PR 值得精读，因为它展示了如何修复因硬件特定后端遗漏导致的性能回归，并涉及了注意力后端集成的设计决策（如后端支持列表的管理）。关注点包括：Flux 2 模型的后端选择机制、AITER 实现的张量布局约定，以及 review 中关于集成完整性的讨论。

diffusionfeatureamd

#23327 Skip mamba_pool_idx revert for session requests in _get_new_batch_prefill_raw

原始 PR · 作者 shenxiul · 合并时间 2026-04-22 22:28

缺陷修复重要性 5.63 洞察度 4.00

修复调度器中会话请求的Mamba池索引双重释放问题。

该PR值得精读，尤其是对于涉及会话管理和Mamba模型调度的开发者。关注点在于理解会话槽位生命周期与调度器批次管理之间的交互，以及如何通过简单的属性检查避免复杂的资源管理冲突。

bugfixschedulingkv-cache

#23467 fix: dot-boundary match in is_layer_skipped for FP8 modules_to_not_convert

原始 PR · 作者 mickqian · 合并时间 2026-04-22 22:16

缺陷修复重要性 6.65 洞察度 5.00

修复FP8量化配置中模块路径匹配错误，避免因子串误判导致模型加载失败。

该PR值得精读，尤其是 `_module_path_match` 函数的设计展示了如何处理模块路径的精确匹配，避免子串误判，这在大型模型配置管理中是一个常见痛点。关注点包括：点边界匹配的逻辑、后备映射的引入策略、以及为何未采纳简化建议（可能出于可读性或防御性编程考虑）。

bugfixfp8quant

#23459 [NPU] [DOC] Update Ascend NPU best practice

原始 PR · 作者 amote-i · 合并时间 2026-04-22 17:51

文档重要性 3.01 洞察度 1.00

更新Ascend NPU最佳实践文档，调整Qwen3-Next配置为单卡

该PR为纯文档更新，技术含量低，不值得精读。但可关注其中关于单卡配置的推荐，为Ascend NPU用户提供参考。

documentationnpurun-ci

#23447 [CI] Move disaggregation basic CI back to 2-gpu suite

原始 PR · 作者 ShangmingCai · 合并时间 2026-04-22 17:50

基础设施重要性 3.27 洞察度 2.00

将解聚基本CI测试从4卡迁移回2卡套件

该PR为纯粹的CI配置调整，无核心逻辑变更，不值得精读。但可作为CI资源优化的参考案例。

cirun-ci

#23465 Add 'allready' to ignore words list in .codespellrc

原始 PR · 作者 merrymercy · 合并时间 2026-04-22 17:39

其他重要性 1.99 洞察度 1.00

将 'allready' 加入 codespell 忽略词列表

此 PR 属于工具配置维护，无需精读。可作为了解项目代码规范辅助工具的参考。

#23419 [model_runner] Label forward steps in profile traces with mode and token counts

原始 PR · 作者 minosfuture · 合并时间 2026-04-22 17:31

功能重要性 6.96 洞察度 5.00

为模型前向步骤添加性能追踪标签

值得合并，提升可观测性且零开销。

observabilityperformance

#22658 PD streaming: batch notify + SSE fast path

原始 PR · 作者 inkcherry · 合并时间 2026-04-22 17:21

性能优化重要性 7.94 洞察度 7.00

批处理通知+SSE快速路径，PD streaming吞吐+20%

强烈推荐合并。该PR提供了明确的性能收益和可衡量的基准结果。值得精读的部分包括：如何用msgspec替换Pydantic进行SSE序列化，以及批量通知模式的设计权衡。后续可关注IPC序列化迁移（PR #21643）以进一步释放性能。

performanceschedulingrun-ci

第 223 / 357 页 · 共 2853 条

上一页 1 … 221 222 223 224 225 … 357 下一页