Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 12:34 同步状态：空闲下次计划：2026-06-07 13:34

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-04-04

#21906 [Bugfix] Temporarily skip TRTLLM attention on (G)B300 (SM103) to avoid high-concurrency hang

原始 PR · 作者 mmangkad · 合并时间 2026-04-04 05:19

缺陷修复重要性 6.00 洞察度 5.00

临时跳过SM103 GPU上的TRTLLM attention以避免高并发挂起，改用FA4后端。

该PR值得精读，特别是关注硬件特定问题的处理方式，以及attention后端选择逻辑的设计权衡，如精确检测与范围检测的对比。

bugfixrun-ciperformance

#22054 [Fix] XGrammarGrammarBackend reset to clear inherited cache

原始 PR · 作者 YzXiao101 · 合并时间 2026-04-04 05:18

缺陷修复重要性 3.00 洞察度 2.00

修复XGrammar后端reset方法未调用父类缓存清理的问题。

该PR变更简单直接，值得快速浏览以理解语法缓存清理的继承关系。关注点：XGrammarGrammarBackend如何集成到语法后端体系，以及reset方法在缓存管理中的作用。

bugfixrun-ciconsistency

#22009 chore: bump sglang-kernel version to 0.4.1

原始 PR · 作者 sglang-bot · 合并时间 2026-04-04 04:58

dependencies 重要性 2.00 洞察度 1.00

将sglang-kernel依赖版本从0.4.0升级至0.4.1，确保版本一致性。

此PR变更简单直接，无需深入精读。建议关注点： 1. 了解sglang-kernel 0.4.1的具体变更内容（可能在其他PR或changelog中）。 2. 确认CI测试通过，验证新版本内核的兼容性。 3. 作为依赖管理模式的参考，展示了如何通过多文件同步保持版本一致性。

dependenciesrun-ci

#22028 [Kernel] Make FA3/FA4 imports lazy in FlashAttentionBackend

原始 PR · 作者 merrymercy · 合并时间 2026-04-04 04:49

重构重要性 4.00 洞察度 5.00

懒加载FlashAttention内核导入，避免FA4依赖未安装时的导入错误。

对于关注内核优化、依赖管理或代码设计的工程师，值得精读。设计决策体现了懒加载模式的应用，展示了如何优化模块导入策略以提升兼容性。

refactorperformancemultimodal

#22047 Revert "[Feature] NVFP4 Marlin fallback for non-Blackwell GPUs (SM75+…

原始 PR · 作者 b8zhong · 合并时间 2026-04-04 04:12

其他重要性 7.00 洞察度 5.00

回滚NVFP4 Marlin降级支持，仅限Blackwell GPU使用FP4量化。

建议技术管理者关注此变更对硬件支持策略的影响，工程师可精读Marlin内核模板修改以理解FP4量化实现细节，但回滚本身设计决策较少，重点在于风险缓解。

quantjit-kernelrefactor

#21917 Fix DP attention worker port binding for IPv6 support

原始 PR · 作者 842974287 · 合并时间 2026-04-04 03:39

缺陷修复重要性 5.00 洞察度 4.00

修复DP注意力工作进程端口绑定，支持IPv6网络环境。

该PR值得精读，特别是对于处理分布式网络通信和IPv6迁移的工程师。关注get_zmq_socket_on_host的IPv6检测逻辑，以及dist_init_addr解析的健壮性设计。

bugfixrun-cischeduling

#22065 [HiSparse]: Optimize server args checking-HiSparse is temporarily only available for DSA models.

原始 PR · 作者 hzh0425 · 合并时间 2026-04-04 02:23

缺陷修复重要性 3.00 洞察度 2.00

限制HiSparse功能仅适用于DSA模型，添加服务器参数检查断言。

该PR变更简单直接，适合快速浏览以了解HiSparse的功能限制。对于深入理解HiSparse实现或DSA模型特性的工程师，可关注is_deepseek_nsa函数的定义和模型配置结构。无需精读，除非负责相关模块维护。

bugfixrun-cihicache

#22040 [diffusion] fix: fix gated repo failing the generate cmd

原始 PR · 作者 mickqian · 合并时间 2026-04-04 00:43

缺陷修复重要性 4.00 洞察度 5.00

修复扩散模型门控仓库在 CLI 生成命令中的检测失败问题。

该 PR 代码简洁但展示了优雅的错误恢复和模块化设计，值得 CLI 和扩散模型开发人员参考，特别是如何处理网络依赖和门控仓库检测的场景。建议关注 _is_gated_diffusion_repo 的实现细节和异常处理策略。

bugfixdiffusionrun-ci

第 300 / 357 页 · 共 2850 条

上一页 1 … 298 299 300 301 302 … 357 下一页