Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 11:28 同步状态：空闲下次计划：2026-06-07 12:28

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-05-21

#25366 [auto-detect] match Ring-2.6/Ling XML kv tool-call format via vocab signature

原始 PR · 作者 JustinTong0323 · 合并时间 2026-05-21 14:34

功能重要性 5.94 洞察度 5.00

添加 XML KV 格式的词汇表自动检测

推荐快速合并。这是一个设计优雅、测试完备的增量修复，通过简单的词汇特征显著提升兼容性，同时保持精确匹配。

featurerefactortest

#25266 [AMD][CI] Clean up AMD nightly + pr-test workflows

原始 PR · 作者 bingxche · 合并时间 2026-05-21 14:30

基础设施重要性 6.09 洞察度 5.00

AMD CI 工作流清理与修复

对于 CI 基础设施维护人员值得精读，展示了如何系统地清理和修复 CI 工作流：识别功能性 bug、统一命名、对齐逻辑、补充输入参数。特别是 run_all_tests 和 continue_on_error 的串联设计值得借鉴。对于一般开发者了解 AMD CI 结构也有帮助。

amdciinfra

#25947 fix(model-gateway): rustfmt nightly in conversations/handlers.rs

原始 PR · 作者 whybeyoung · 合并时间 2026-05-21 14:29

基础设施重要性 4.07 洞察度 1.00

修复 Rust 格式化检查失败

该 PR 属于基础设施维护，可快速合入。建议后续在 CI 中统一强制格式化检查，避免类似问题反复出现。

model-gatewayinfra

#23809 fix act fun for xpu

原始 PR · 作者 sushildubey171 · 合并时间 2026-05-21 14:02

功能重要性 5.83 洞察度 3.00

为 XPU 添加 SiluMul 和 Rotary Embedding 前向路径

变更简单且逻辑清晰，建议合并。值得关注的设计决策是：将 XPU 的 silu_and_mul 导入与 HIP 共享同一条件分支，暗示了 `sgl_kernel` 对两者均支持的意图。

xpuinteldiffusion

#25907 Fix FlashInfer A2A token cap sizing

原始 PR · 作者 merrymercy · 合并时间 2026-05-21 14:01

缺陷修复重要性 5.34 洞察度 4.00

修复 FlashInfer A2A token 容量双倍计数

此 PR 为针对 MoE 推理中 FlashInfer A2A dispatcher 的小型 bugfix，设计简洁，值得关注其默认值调整和注释中的空间计算解释。

bugfixmoeperformance

#25367 Fix EPLB redundant experts with shared expert fusion and Waterfill

原始 PR · 作者 xutizhou · 合并时间 2026-05-21 13:58

缺陷修复重要性 6.51 洞察度 6.00

修复 EPLB 冗余专家与 DeepEP Waterfill 冲突

值得精读。PR 修复了一个在冗余专家场景下的非明显 bug，展示了 EPLB 与 DeepEP Waterfill 之间的交互依赖。设计决策（如区分逻辑/物理 expert 计数、共享权重的槽位映射）对理解 MoE 系统具有参考价值。

bugfixmoeperformance

#25054 Support Gemma4 MoE NVFP4

原始 PR · 作者 pyc96 · 合并时间 2026-05-21 13:45

功能重要性 8.00 洞察度 6.00

支持 Gemma4 MoE NVFP4 模型推理

该 PR 值得精读，特别是 `FusedMoE.make_expert_params_mapping` 的复用模式以及 `get_activation_type` 的 gated/non-gated 抽象设计。权重加载部分的 per-expert 映射逻辑是值得关注的设计决策。建议在合并后补充单元测试覆盖新的映射路径。

moequantblackwell

#25889 [Fix] DSV4 cached_loc invalidated when SWA mapping is rebuilt

原始 PR · 作者 ch-wan · 合并时间 2026-05-21 13:38

缺陷修复重要性 8.49 洞察度 6.00

修复 DSV4 cached_loc 在映射重建后未失效

值得精读，尤其是测试分层设计——从协议桩（stub）到崩溃回归再到端到端 KL 验证，展示了高质量的防御性编程。适合作为缓存失效类 bug 的修复范本。

bugfixdeepseekkv-cache

第 88 / 357 页 · 共 2850 条

上一页 1 … 86 87 88 89 90 … 357 下一页