Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 16:47 同步状态：空闲下次计划：2026-06-07 17:47

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-04-06

#21243 [Spec][Ngram] 5/N: Store and advance anchor match state across decode steps

原始 PR · 作者 kpham-sgl · 合并时间 2026-04-06 13:21

重构重要性 7.00 洞察度 6.00

优化Ngram推测解码的锚点匹配，从O(D²)降至O(1)以提升性能。

建议精读，特别是Trie::match的状态化实现和MatchState的设计，这是优化核心路径的典型案例，值得关注版本控制和缓存失效策略。

speculative-decodingrefactorperformance

#22111 [diffusion] model: support LTX2.3

原始 PR · 作者 mickqian · 合并时间 2026-04-06 12:26

功能重要性 7.00 洞察度 6.00

为扩散模型添加LTX-2.3支持，包括覆盖材料化、配置更新和管道集成。

建议技术管理者关注覆盖材料化设计，这是处理外部模型权重的关键模式，值得学习；工程师应精读materialize.py和管道更新（如ltx_2_pipeline.py），以理解LTX-2.3集成逻辑。注意review中未解决的回归风险和文档不一致，需后续验证。

diffusionfeaturedocumentation

#22006 Tiny fix trtllm_fp8_per_tensor_scale_moe_wrapper router_logits dtype

原始 PR · 作者 Qiaolin-Yu · 合并时间 2026-04-06 12:11

缺陷修复重要性 4.00 洞察度 5.00

修复DeepSeekV3模型在per-tensor FP8量化下router_logits数据类型错误

该PR值得关注，尤其是对于使用DeepSeekV3模型和FP8量化的团队。虽然改动小，但揭示了模型量化实现中的细节依赖关系。建议：1) 了解flashinfer库对dtype的要求如何影响不同路由方法。2) 检查其他量化路径（如block scale）是否已有类似修复以确保一致性。3) 考虑为这类dtype依赖添加单元测试。

bugfixrun-ciquant

#22176 Fix ut module importing

原始 PR · 作者 ispobock · 合并时间 2026-04-06 11:53

测试重要性 4.00 洞察度 5.00

移除 req_time_stats 单元测试文件并重构两个测试文件的导入机制，避免 CPU-only 环境依赖问题。

建议技术管理者关注测试覆盖缺口，考虑在后续 PR 中恢复或替换被移除的测试。工程师应精读 test_request_metrics_exporter.py 的 stubbing 逻辑，评估其健壮性，并确保无条件 stub 以避免 flaky。

testrun-ciconsistency

#22143 Cache gfx95 quant format detection in DeepseekV2DecoderLayer

原始 PR · 作者 merrymercy · 合并时间 2026-04-06 11:20

性能优化重要性 5.00 洞察度 4.00

缓存DeepSeekV2解码层中gfx95量化格式检测逻辑，避免每次前向传播重复计算。

该PR值得精读，尤其是关注量化格式检测的缓存设计决策。建议关注：1. 惰性初始化与缓存的实现方式，如何平衡初始化开销和运行时性能。2. 检测逻辑的健壮性，特别是权重可能为None的情况处理。3. 与近期PR#22134（修复DeepSeek-V2路由器GEMM）的关联，显示DeepSeek模型优化是当前重点。

deepseekperformancerefactor

#21589 [sgl] two potential spec_v2 bug fixes

原始 PR · 作者 bixue2010 · 合并时间 2026-04-06 10:41

缺陷修复重要性 5.00 洞察度 4.00

修复Speculative Decoding V2中Eagle3模型崩溃的两个潜在bug。

建议精读，特别是logits_processor.py中的aux_pruned_states修复，展示了如何处理多隐藏状态切片和拼接的模式。关注条件检查（if aux_hidden_states is not None）和列表推导式的使用，这是处理可选参数的典型做法。

speculative-decodingbugfixrun-ci

#21400 [CI] Add unit tests for srt/utils/auth.py

原始 PR · 作者 Lidang-Jiang · 合并时间 2026-04-06 10:30

测试重要性 4.00 洞察度 4.00

为srt/utils/auth.py认证模块添加29个CPU-only单元测试。

建议团队阅读此PR以学习如何编写全面的单元测试，特别是认证逻辑的边界覆盖。对于新贡献者，可作为测试编写的最佳实践参考，但变更机械简单，无需深入解析代码逻辑。

testrun-ciconsistency

#21399 [CI] Add unit tests for function_call detectors (hermes, llama32, mistral)

原始 PR · 作者 Lidang-Jiang · 合并时间 2026-04-06 10:29

测试重要性 4.00 洞察度 5.00

添加Hermes、Llama32、Mistral功能调用检测器的39个CPU-only单元测试。

建议工程师精读此PR，学习如何为不同格式的检测器设计全面测试用例，特别是流式增量解析的测试方法。关注review讨论中的改进点，如使用`CustomTestCase`和加强断言，这些是提升测试质量的关键决策。

testrun-ciconsistency

第 292 / 358 页 · 共 2857 条

上一页 1 … 290 291 292 293 294 … 358 下一页

sgl-project/sglang

PR 列表

#21243 [Spec][Ngram] 5/N: Store and advance anchor match state across decode steps

#22111 [diffusion] model: support LTX2.3

#22006 Tiny fix trtllm_fp8_per_tensor_scale_moe_wrapper router_logits dtype

#22176 Fix ut module importing

#22143 Cache gfx95 quant format detection in DeepseekV2DecoderLayer

#21589 [sgl] two potential spec_v2 bug fixes

#21400 [CI] Add unit tests for srt/utils/auth.py

#21399 [CI] Add unit tests for function_call detectors (hermes, llama32, mistral)

参与讨论