Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 10:11 同步状态：空闲下次计划：2026-06-07 11:11

后台正在同步并分析最近 PR，页面会自动刷新并逐步显示最新结果。

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-05-19

#25524 [Bug Fix] Align glm4_moe_nextn NPU MTP loading with qwen3 MTP

原始 PR · 作者 zRzRzRzRzRzRzR · 合并时间 2026-05-19 21:47

缺陷修复重要性 6.79 洞察度 5.00

对齐 NPU 上 GLM-4.7 MTP 加载路径

该 PR 适合精读，特别是关注 SLANG 中 MTP 推测解码的实现细节和 NPU 平台的量化策略。其中的清理工作（移除冗余上下文管理器、简化控制流）体现了代码质量演进方向。

bugfixnpudeepseek

#25778 [NPU] [DOC] remove Qwen3-235B-A22B 2K+2K 100ms mixed mode benchmark

原始 PR · 作者 amote-i · 合并时间 2026-05-19 20:48

文档重要性 3.58 洞察度 1.00

移除 NPU 文档中的 100ms 基准配置

此 PR 仅为文档清理，可快速合并。但建议跟进 reviewer 的意见，确保表格中的引用一致性。

documentationnpu

#25732 pr-test-extra: re-trigger on labeled event

原始 PR · 作者 hnyls2002 · 合并时间 2026-05-19 20:15

功能重要性 5.40 洞察度 5.00

CI工作流支持labeled事件重新触发

该 PR 设计完善，文档清晰，推荐 CI 管理者精读。值得关注的设计决策是通过 `labeled` 事件绕开 `run.rerun()` 不可用的问题，这是一个很好的 GitHub Actions 实践。建议后续为 handler 增加单元测试。

ciinfradocumentation

#25764 [Codex] Remove stale DeepSeek V4 JIT kernels

原始 PR · 作者 BBuf · 合并时间 2026-05-19 20:04

重构重要性 5.91 洞察度 2.00

移除陈旧的 DeepSeek V4 JIT 内核

值得快速合并。虽然简单删除，但展示了清理无用代码的最佳实践：用 rg 验证无引用后删除，并保留 git 历史供回溯。

deepseekjit-kernelquant

#23482 [Diffusion][NPU]Add attention backends for diffusion models for Ascend NPU

原始 PR · 作者 Napkin-AI · 合并时间 2026-05-19 17:46

功能重要性 9.00 洞察度 6.00

NPU扩散模型新增三种注意力后端

值得精读，尤其是如何在现有注意力抽象框架中新增后端，以及平台选择逻辑的 try-except 降级处理。对于 NPU 相关开发者，Rain Fusion 和 Block Sparse 的实现细节需关注 review 中的性能优化建议。

diffusionnpufeature

#25592 [Diffusion] [NPU] Fix HunyuanVideo crash on NPU

原始 PR · 作者 LLThomas · 合并时间 2026-05-19 17:40

缺陷修复重要性 4.71 洞察度 2.00

修复NPU上 Tensor.view 非连续张量崩溃

这是一个最小化、安全的 bugfix，值得直接合入。无需精读，但可作为 NPU 兼容性修复的示例参考。

bugfixdiffusionnpu

#23922 transformers v5 adapt HFRunner

原始 PR · 作者 Hide-on-bushsh · 合并时间 2026-05-19 17:07

缺陷修复重要性 4.61 洞察度 4.00

适配 transformers v5 的 HFRunner 变更

该 PR 属于紧急兼容性修复，但 review 中提出的两个问题尚未解决。建议作者确认 transformers v5 中 Qwen2VLForConditionalGeneration 的 vision tower 输出格式，若确实需要 pooler_output 则需调整赋值逻辑；同时避免使用 `**kwargs` 或明确过滤参数。在修复前不宜合并到 main。

bugfixnputest

#25396 fix: fix deepseek v4 CP error

原始 PR · 作者 shiyu7 · 合并时间 2026-05-19 17:04

缺陷修复重要性 5.43 洞察度 5.00

修复 DeepSeek V4 CP 中张量不连续崩溃

值得精读，尤其是理解 JIT 内核与张量连续性的依赖关系。建议同步检查 `_compute_kv_to_cache` 的类似问题。

bugfixdeepseekconf

第 99 / 357 页 · 共 2850 条

上一页 1 … 97 98 99 100 101 … 357 下一页