Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 17:58 同步状态：空闲下次计划：2026-06-07 18:58

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-04-08

#22290 [fix] Fix writer lock deadlock in update_weights_from_ipc during pause_generation

原始 PR · 作者 maocheng23 · 合并时间 2026-04-08 09:32

缺陷修复重要性 5.00 洞察度 4.00

修复调度器暂停模式下IPC权重更新时的写锁死锁问题。

该PR值得关注，特别是对于处理并发控制和调度器状态管理的开发者。虽然变更较小，但展示了在复杂并发场景下如何安全地绕过锁机制的设计思路。建议仔细阅读update_weights_from_ipc函数的实现，理解is_pause_cond条件变量与model_update_lock的交互关系。

bugfixrun-cirefactor

#22301 Only upload CUDA coredumps on test failure

原始 PR · 作者 hnyls2002 · 合并时间 2026-04-08 09:07

基础设施重要性 3.00 洞察度 2.00

优化CI工作流，仅在测试失败时上传CUDA coredump，减少资源浪费。

此PR变更简单但有效，值得CI维护工程师关注以了解优化实践；对于一般开发者，可快速浏览确认变更覆盖范围，无需深入代码解析。

run-cirefactor

#22297 Revert "[CI] Update nightly test models for H200/B200 (#22288)"

原始 PR · 作者 Kangyan-Zhou · 合并时间 2026-04-08 08:04

基础设施重要性 4.00 洞察度 2.00

撤销 H200/B200 夜间测试模型更新，恢复至先前配置。

该 PR 是一个简单的 revert 操作，建议快速审查以确保没有意外副作用，无需深入技术分析。但应关注是否后续有替代 PR 来解决原始问题，并监控 CI 稳定性。

run-citest

#21931 [CI] Migrate mgsm_en eval to gsm8k to remove openaipublic dependency

原始 PR · 作者 dougyster · 合并时间 2026-04-08 07:29

基础设施重要性 4.00 洞察度 3.00

迁移CI测试数据集从MGSM-EN到GSM8K，移除外部依赖并调整阈值。

建议CI维护者、测试工程师和关注模型准确性的开发者精读，重点关注阈值校准策略和依赖管理决策；对一般工程师，了解变更背景即可，无需深入代码细节，但可参考如何优化CI稳定性。

run-citestquant

#21240 [NVIDIA] Enable FP4 flashinfer trtllm routed moe

原始 PR · 作者 trevor-m · 合并时间 2026-04-08 07:16

功能重要性 6.00 洞察度 5.00

为FlashInfer TRTLLM路由MoE后端启用FP4量化支持。

对于使用MoE和量化特性的工程师，该PR值得精读以理解FP4路由MoE的实现细节；重点关注 `flashinfer_trtllm.py` 中的逻辑变更，以及如何集成新后端到量化配置中。

quantrun-cifeature

#22284 Add fast-fail to multimodal-gen CI

原始 PR · 作者 hnyls2002 · 合并时间 2026-04-08 06:56

基础设施重要性 3.00 洞察度 3.00

为多模态生成CI添加快速失败机制，提升PR测试效率。

该PR变更直接，适合快速审阅以了解CI优化策略。关注点：check-stage-health步骤的添加确保了环境检查一致性；pytest -x的引入体现了CI场景差异化设计（PR vs 定时运行）。

run-cidiffusionmultimodal

#22288 [CI] Update nightly test models for H200/B200

原始 PR · 作者 Kangyan-Zhou · 合并时间 2026-04-08 06:44

基础设施重要性 4.00 洞察度 3.00

更新H200/B200夜间测试套件，移除旧模型并改用Qwen3.5 FP8权重。

建议测试和DevOps团队审阅此变更，以确保夜间测试覆盖仍满足质量要求。对于工程师，值得关注Qwen3.5 FP8权重和DP-attention变体的测试配置，可作为模型部署和性能优化的参考。

run-citestdeepseek

#22232 Reduce unnecessary kernels and copies in the NSA indexer

原始 PR · 作者 1am9trash · 合并时间 2026-04-08 06:37

性能优化重要性 5.00 洞察度 6.00

优化NSA索引器内核融合与内存拷贝，提升AMD平台推理性能。

该PR值得精读，尤其是对于关注AMD平台性能优化和内核融合技术的工程师。重点关注_update_rope_guarded的设计决策，它展示了如何通过内存地址检查避免冗余拷贝，这是一种在特定上下文中有效的优化模式，但需注意其依赖的假设条件。

performancerun-ciamd

第 286 / 358 页 · 共 2863 条

上一页 1 … 284 285 286 287 288 … 358 下一页