Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 12:34 同步状态：空闲下次计划：2026-06-07 13:34

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-04-13

#22505 Add bfloat16 KV cache validation for HiSparse

原始 PR · 作者 mmangkad · 合并时间 2026-04-13 12:41

功能重要性 4.00 洞察度 3.00

为HiSparse添加bfloat16 KV缓存验证，确保启用时数据类型正确。

该PR实现简单但关键，建议精读以理解HiSparse对KV缓存数据类型的依赖关系。关注设计决策：选择严格验证而非自动转换，体现了对数据类型一致性的重视。

run-cihisparsescheduling

#22631 [codex] Add LTX-2.3 benchmark skill recipes

原始 PR · 作者 BBuf · 合并时间 2026-04-13 12:23

文档重要性 4.00 洞察度 3.00

为LTX-2.3扩散模型添加一阶段和二阶段基准测试技能配方。

建议阅读此PR以了解扩散基准测试的技能设置，但需关注GPU数量设置的决策，可能反映了性能权衡或特定硬件假设。对于基准测试一致性，建议后续评估GPU配置优化。

documentationrun-cidiffusion

#22652 Simplify test_chunked_prefill; remove redundant tests

原始 PR · 作者 hnyls2002 · 合并时间 2026-04-13 11:26

测试重要性 3.00 洞察度 3.00

简化 chunked prefill 测试套件，移除冗余用例以缩短 CI 时间。

推荐技术管理者关注此 PR 作为测试优化案例，工程师可学习如何识别冗余测试以提升 CI 效率。对于关注调度或测试覆盖的团队成员，值得精读以理解测试重构策略和风险权衡。

run-citestrefactor

#22649 Revert "[Diffusion] Add FLUX.1-dev ModelOpt NVFP4 support (#22574)"

原始 PR · 作者 mickqian · 合并时间 2026-04-13 11:17

缺陷修复重要性 6.00 洞察度 5.00

撤销FLUX.1-dev ModelOpt NVFP4支持，修复CI测试失败。

建议技术管理者精读此PR以理解CI失败原因和revert策略，工程师应关注flux.py中的代码不一致性问题，并考虑后续清理未使用参数。该PR揭示了量化功能集成中的测试和代码一致性挑战。

diffusionquantrun-ci

#21206 [RaidxTree Refactor]: Support Unified HybridRadixTree V2

原始 PR · 作者 hzh0425 · 合并时间 2026-04-13 10:28

重构重要性 8.00 洞察度 7.00

统一多组件radix tree框架，替代独立的MambaRadixCache和SWARadixCache，支持插件化组件以简化扩展。

该PR值得精读，尤其是unified_radix_cache.py和tree_component.py中的设计决策。关注点：组件化架构如何实现资源隔离和驱逐优先级，以及如何通过接口避免核心树逻辑的特殊处理。建议在启用前进行大规模测试以验证线程安全和性能，并监控环境变量启用后的实际效果。

refactorfeaturekv-cache

#22204 [RL] Refactor NVFP4 shuffling/swizzling to in-place replacement

原始 PR · 作者 zianglih · 合并时间 2026-04-13 10:08

重构重要性 6.00 洞察度 5.00

重构 NVFP4 shuffling/swizzling 为原地替换，修复 FlashInfer TRT-LLM backend 的权重更新问题。

建议技术管理者和工程师精读此 PR，重点关注重构后的权重管理逻辑和条件检查设计。值得学习的决策包括：如何通过原地替换优化内存使用和性能，以及如何处理量化 backend 的兼容性权衡。同时，应审查条件检查的安全性，确保在权重对齐失败时能优雅处理。

quantrefactornpu

#21367 [CPU] Fix argument issues in qkv_proj_with_rope_fused_weight and bmm…

原始 PR · 作者 blzheng · 合并时间 2026-04-13 09:59

缺陷修复重要性 4.00 洞察度 3.00

修复CPU后端DeepSeek-V3.1-Terminus模型运行时的参数类型错误。

该PR值得快速浏览以了解CPU后端量化参数传递的细节。关注点：1. qkv_proj_with_rope_is_fp8标志的使用方式，反映了量化类型的内核分发逻辑。2. 内核函数接口（w_scale类型为Optional[Tensor]）的设计，可能影响其他量化场景。对于维护CPU后端或量化模块的工程师，此修复提供了处理类似类型不匹配问题的参考模式。

bugfixrun-cideepseek

#22647 Extract pause_resume_in_place kit; rename test_abort to test_scheduler_control

原始 PR · 作者 hnyls2002 · 合并时间 2026-04-13 09:49

重构重要性 4.00 洞察度 4.00

提取暂停/恢复测试为可重用工具包，并重命名测试文件和类以扩展调度控制测试范围。

建议团队关注此PR，作为测试代码重构的案例学习。特别值得注意的设计决策是使用Mixin模式提取公共测试逻辑，但需留意review中未解决的配置性和错误处理问题，未来可考虑采纳改进建议以提升测试可靠性。

run-cirefactortest

第 261 / 357 页 · 共 2850 条

上一页 1 … 259 260 261 262 263 … 357 下一页