Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-13 17:27 同步状态：空闲下次计划：2026-06-13 18:27

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-05-01

#23557 [Intel GPU] Integrate flash_mla_decode in Intel XPU attention backend

原始 PR · 作者 polisettyvarma · 合并时间 2026-05-01 07:21

功能重要性 7.27 洞察度 5.00

Intel XPU 后端集成 MLA decode 支持

此 PR 值得精读，尤其是了解如何将硬件特定内核（flash_mla_decode）集成到现有注意力后端架构中，以及如何通过参数验证来强制执行配置约束。三个技术决策值得关注：1）在 `init_forward_metadata` 中分配工作空间的方式；2）对 speculative decoding 的显式断言；3）非 MLA 和 MLA 模型的不同 page_size 约束设计。

featureinteldeepseek

#22236 [Test] Add XPU device support to unit tests

原始 PR · 作者 singhalshubham03 · 合并时间 2026-05-01 07:18

功能重要性 5.36 洞察度 5.00

为三个测试文件添加XPU设备支持

此PR展示了在SGLang中为测试添加新硬件支持的标准化方法：使用`get_device()`替代硬编码设备字符串，并相应调整跳过条件。虽然改动量小，但可以作为今后测试跨硬件适配的模板。建议阅读`test_triton_scaled_mm.py`的完整实现，以及review评论中关于安全调用`torch.xpu`的讨论，以避免类似问题。总体而言，值得快速浏览，但不需要深入精读。

intelxputest

#23438 feat: implement workflow to sync LMSYS SGLang blog

原始 PR · 作者 zijiexia · 合并时间 2026-05-01 07:17

功能重要性 6.06 洞察度 4.00

添加自动同步 LMSYS 博客到文档的工作流

值得关注工作流设计模式：利用 GitHub Actions 定时同步外部内容并通过条件提交实现自动化。删除冗余元数据的设计也体现了持续简化。不过建议后续补充断链检查等配套验证。

featurecidocumentation

#24174 ci: temporarily disable multimodal-gen-test-1-b200

原始 PR · 作者 alisonshao · 合并时间 2026-05-01 07:16

基础设施重要性 3.86 洞察度 3.00

临时禁用 CI 中断言失败的多模态任务

该 PR 是一个典型的短期 CI 修复措施，内容简单直接。建议阅读者确认后续 tokenizer 修复后及时恢复该任务，避免长期测试覆盖缺失。设计决策亮点在于使用 `if: false` 而非完全移除 job，保留了任务定义和恢复路径。

run-citest

#20234 Use device-agnostic helpers for Mamba tests and core ops

原始 PR · 作者 roopaksrivastav · 合并时间 2026-05-01 07:14

基础设施重要性 5.66 洞察度 3.00

Mamba 测试与内核设备无关化以支持 XPU

值得关注 `get_device`、`get_device_count` 等辅助函数的设计模式，可作为后续设备无关化重构的参考。

testrefactornpu

#13599 Replace hardcoded CUDA device with get_device() for XPU support

原始 PR · 作者 kalyank007 · 合并时间 2026-05-01 07:13

重构重要性 6.84 洞察度 4.00

替换硬编码 CUDA 设备为 get_device() 以支持 XPU

建议精读。虽然变更本身简单，但它展示了在大型项目中如何逐步引入设备抽象模式。重点关注 `llama.py` 中的条件分支和 `expert_distribution.py` 中通过 `get_device()` 抽象张量设备的方式，这对于未来支持更多硬件（如 NPU、AMD GPU）有参考价值。

xpurefactortest

#24179 Revert "ci: add rebase-required mode to check-maintenance action"

原始 PR · 作者 Kangyan-Zhou · 合并时间 2026-05-01 07:11

基础设施重要性 4.33 洞察度 2.00

回退 rebase-required CI 检测模式

该 PR 是纯粹的回退操作，变更简单直接。建议关注回退后的 CI 稳定性，以及是否有替代方案来满足原始需求（要求 PR rebase）。如果不需要该功能，可以放心合入。

cidocumentation

#24176 [CI] Publish nightly sglang wheel under both cu129 and cu130 indexes

原始 PR · 作者 Kangyan-Zhou · 合并时间 2026-05-01 07:09

基础设施重要性 5.56 洞察度 4.00

nightly wheel 同时注册 cu129 和 cu130

建议合入。改动简洁、风险低，且提升了用户便利性。值得关注的是 `update_nightly_whl_index.py` 中错误处理的改进（从静默失败到显式抛出），这种模式值得在其他 CI 脚本中推广。

cidependencies

第 227 / 396 页 · 共 3165 条

上一页 1 … 225 226 227 228 229 … 396 下一页