Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 10:11 同步状态：空闲下次计划：2026-06-07 11:11

后台正在同步并分析最近 PR，页面会自动刷新并逐步显示最新结果。

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-04-29

#23833 [JIT Kernel][1/2]Migrate MXFP8 Group GEMM & Quant into JIT

原始 PR · 作者 HydraQYH · 合并时间 2026-04-29 22:50

功能重要性 9.18 洞察度 8.00

MXFP8 MoE Group GEMM & Quant 迁移至 JIT，Blackwell 加速

值得精读，尤其是 Python 端 JIT 编译集成模式（cache_once + load_jit）和 MoE Group GEMM 的 CUTLASS 实现。2SM 策略在 memory-bound 场景的加速效果值得关注。作为系列 PR 的第 1 部分，建议跟踪后续集成。

jit-kernelquantperformance

#24008 [diffusion] fix: align encoder of flux klein with official

原始 PR · 作者 mickqian · 合并时间 2026-04-29 22:42

缺陷修复重要性 7.02 洞察度 5.00

Flux Klein 文本编码器对齐官方，引入 masked causal attention

该 PR 值得精读，特别是 `_masked_causal_attention` 的实现展示了如何在不依赖 FlashAttention 内置 masking 时手动处理变长批处理注意力，对扩散模型文本编码器设计有参考价值。

diffusionbugfixtest

#24065 [AMD] Update AMD CI workflow concurrency group

原始 PR · 作者 yctseng0211 · 合并时间 2026-04-29 22:39

基础设施重要性 3.34 洞察度 2.00

修复 AMD CI workflow_dispatch 并发冲突

值得合并，变更简单明确，解决了工具链的使用体验问题。

amdci

#24022 [diffusion] fix: improve LTX2.3 reference accuracy controls

原始 PR · 作者 mickqian · 合并时间 2026-04-29 21:39

缺陷修复重要性 7.54 洞察度 5.00

改进 LTX2.3 参考精度与对齐控制

该 PR 展示了如何通过逐步对齐官方实现来提升扩散模型管线精度，特别是文本连接器 CFG 分支的重构和 V2A 跳过标记的设计，具有参考价值。对于关注扩散模型质量工程化的团队建议精读。

diffusionbugfixtest

#24027 Bugfix

原始 PR · 作者 JustinTong0323 · 合并时间 2026-04-29 21:13

缺陷修复重要性 9.00 洞察度 6.00

修复 Mistral GQA 及 transformers v5 权重加载兼容性

建议核心开发者仔细审查权重重映射的正则字典，确保覆盖所有已知 Mistral 原生权重名。同时应增加相关单元的测试，当前仅依赖 pre-commit 和手动的 cookbook 验证。设计上选择基于 `model_type` 动态选择骨架，思路清晰，值得借鉴。

bugfixrun-cimultimodal

#21685 [NPU] ascend backend support qwen3 moe attention cp

原始 PR · 作者 AndyLi429 · 合并时间 2026-04-29 19:25

功能重要性 7.71 洞察度 6.00

Ascend NPU 为 Qwen3 MoE 标准注意力添加 CP

建议阅读 `_cp_allgather_and_save_kv_npu` 的合并通信策略以及 `do_cp_attn_fia` 的 zigzag 实现，这对类似 CP 实现有参考价值。测试设计也值得学习。

npufeatureperformance

#23481 [BugFix][EPD] fix embedding req_id transfer error

原始 PR · 作者 ZhengWG · 合并时间 2026-04-29 18:56

缺陷修复重要性 6.21 洞察度 5.00

修复 EPD 路径因 ZMQ 端口复用导致的崩溃或数据污染

该 PR 修复了一个隐蔽的并发问题，设计思路清晰，适合精读以理解分布式推理中的端口复用场景和防御性编程实践。建议未来添加对应的单元测试或集成测试覆盖端口复用竞争的边界条件。

bugfixspeculative-decodingrun-ci

#23940 [AMD] Fix CI RuntimeError: opentelemetry package is not installed

原始 PR · 作者 yichiche · 合并时间 2026-04-29 18:02

缺陷修复重要性 3.12 洞察度 3.00

修复 AMD ROCm CI 因缺少 tracing 依赖失败

值得快速合并的配置修复 PR，逻辑清晰，验证充分。对于其他平台开发者，建议检查是否也需要将 tracing 加入对应的 all 组以避免未来 CI 失败。

amddependenciesbugfix

第 195 / 357 页 · 共 2850 条

上一页 1 … 193 194 195 196 197 … 357 下一页