Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 15:44 同步状态：空闲下次计划：2026-06-07 16:44

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-04-06

#22134 [Hotfix] Fix router gemm on sm103

原始 PR · 作者 Fridge003 · 合并时间 2026-04-06 00:33

缺陷修复重要性 5.00 洞察度 4.00

修复DeepSeek-V2模型在SM103设备上路由器GEMM内核优化条件，避免潜在兼容性问题。

该PR值得快速浏览，特别是对于维护DeepSeek模型或硬件兼容性代码的工程师。虽然变更简单，但揭示了硬件特定优化中的微妙权衡：在修复已知问题的同时，可能无意中排除了其他类似设备。建议关注后续是否有更全面的硬件兼容性测试或条件优化策略。

deepseekbugfixrun-ci

2026-04-05

#22104 [SpecV2]: Reopen kl accuracy test for qwen3 + SpecV2

原始 PR · 作者 hzh0425 · 合并时间 2026-04-05 23:26

测试重要性 3.00 洞察度 4.00

为Qwen3 Next MTP模型重新启用SpecV2的KL散度准确性测试。

该PR变更简单，值得快速浏览以了解测试恢复的背景。重点关注KLDivergenceMixin的设计和阈值设置，以及review中关于测试方法执行的讨论。

testrun-cispeculative-decoding

#22062 [BugFix][RadixTree]: Fix backup invariant violation in Hi-MambaRadixTree

原始 PR · 作者 hzh0425 · 合并时间 2026-04-05 23:19

缺陷修复重要性 5.00 洞察度 4.00

修复HiMambaRadixTree在write_through模式下因备份链断裂导致的断言失败问题。

该PR值得精读，特别是对于负责缓存模块的工程师。关注点： 1. 备份不变性设计：理解为什么父节点必须先于子节点备份是缓存一致性的关键。 2. 与HiRadixCache的对比：HiRadixCache没有_evict_regular中的断言，因此容忍此场景；而HiMambaRadixTree有断言，需要显式修复。 3. 防御性编程：write_backup中的条件检查是典型的防御性编程，值得学习。

bugfixrun-cihicache

#22153 [PD] Fix staging warmup for GQA prefill decode different tp

原始 PR · 作者 ShangmingCai · 合并时间 2026-04-05 23:13

缺陷修复重要性 3.00 洞察度 2.00

修复解耦解码中GQA预填充与解码TP不同时staging预热条件检查缺失导致的潜在属性错误。

该PR变更简单直接，无需深入精读。值得关注的是：1. 了解GQA预填充与解码TP不同时staging机制的特殊处理。2. 注意review中关于hasattr与getattr的风格讨论，可作为代码简洁性参考。

bugfixrun-ciconsistency

#22150 Fix flaky test_load_weights_from_remote_instance in CI

原始 PR · 作者 hnyls2002 · 合并时间 2026-04-05 22:46

缺陷修复重要性 4.00 洞察度 3.00

修复CI中test_load_weights_from_remote_instance测试因transfer_engine后端挂起的不稳定问题。

建议工程师精读此PR，了解CI不稳定性根因和修复策略。重点关注remote_instance_weight_loader_start_seed_via_transfer_engine参数的作用，以及测试中随机行为的管理。对于技术管理者，此PR展示了快速修复CI问题的有效方法，但需注意后续测试重构的必要性。

bugfixtestrun-ci

#22148 Unify think_end_id to model_config as single source of truth

原始 PR · 作者 hnyls2002 · 合并时间 2026-04-05 18:35

重构重要性 6.00 洞察度 5.00

统一 think_end_id 存储到 model_config，消除三处冗余

建议精读以理解推理令牌处理的统一化设计模式，关注 scheduler.py 中 tokenizer.encode 调用的边界检查缺失问题，以及语法后端接口从隐式依赖向显式参数传递的演变。

refactorconsistencyrun-ci

#22147 Add dump_metric to MMMU, lm-eval, and NeMo Skills eval paths

原始 PR · 作者 hnyls2002 · 合并时间 2026-04-05 18:23

功能重要性 5.00 洞察度 4.00

为MMMU、lm-eval和NeMo Skills评估路径添加dump_metric调用，统一指标收集

该PR值得快速浏览以了解评估统一计划的进展。关注点：1) dump_metric的静默失败设计确保了安全性。2) review中提到的标签不一致问题值得注意，可能需要在后续PR中解决。3) 这是#21667开始的评估统一计划的一部分，建议结合相关PR理解整体架构。

featuretestconsistency

#22146 Isolate spec V1 path in decode post-processing

原始 PR · 作者 hnyls2002 · 合并时间 2026-04-05 18:16

重构重要性 5.00 洞察度 5.00

隔离Speculative Decoding V1的后处理路径，将推理令牌追踪移至验证阶段。

建议技术管理者和核心工程师精读此PR，重点关注scheduler_output_processor_mixin.py的process_batch_result_decode函数重构，理解is_spec_v1变量的使用和_handle_finished_req辅助函数的设计。这有助于掌握解码后处理的架构改进，并为类似重构提供借鉴。

refactorrun-cispeculative-decoding

第 294 / 357 页 · 共 2856 条

上一页 1 … 292 293 294 295 296 … 357 下一页