Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 12:34 同步状态：空闲下次计划：2026-06-07 13:34

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-05-16

#25433 Remove managers' unused fields

原始 PR · 作者 fzyzcjy · 合并时间 2026-05-16 09:17

重构重要性 6.18 洞察度 3.00

移除 managers 模块中 6 个文件的未使用字段

该 PR 是清理死代码的良好实践，值得合并。对于团队新手，可以借此 PR 了解如何安全地识别和删除未使用字段。建议在合并后运行完整的 CI 测试套件以确认无回归。

refactorinfra

#25432 Remove dead self.adder/can_run_list/running_bs writes in Scheduler._get_new_batch_prefill_raw

原始 PR · 作者 fzyzcjy · 合并时间 2026-05-16 09:12

重构重要性 4.68 洞察度 3.00

清理调度器中的死代码赋值

该 PR 是低风险的清理工作，无需深入审查。但可作为理解 Scheduler 中 prefill 统计信息演进历史的参考：从 `self.adder` 等临时存储迁移到 `new_batch.prefill_stats` 对象化。

refactorinfra

#25430 Convert local-only self.X attributes to locals

原始 PR · 作者 fzyzcjy · 合并时间 2026-05-16 09:05

重构重要性 5.21 洞察度 4.00

移除未使用的 self.X 赋值，改为局部变量

此 PR 属于小范围重构，设计意图清晰但存在一处被指出的潜在 GC 风险尚未解决。建议精读 reviewer 评论并评估 tokenizer_manager.py 的更改是否需要保留引用。对于关注代码清理和属性生命周期管理的工程师有学习价值。整体重要性不高，合并前应确保 disagg 测试通过。

refactor

#25419 Port SGLANG_OPT_SWA_EVICT_DROP_PAGE_MARGIN from deepseek_v4_dev

原始 PR · 作者 yhyang201 · 合并时间 2026-05-16 08:39

缺陷修复重要性 4.99 洞察度 4.00

修复 SWA 逐出边界 env 变量未生效 bug

值得精读的场景：关注 SWA cache 逐出策略的开发者；希望了解多分支间 env 变量移植实践的读者。推荐与 #24857 和 `swa_radix_cache.py` 中 `_insert_helper` 的 case 3 对照阅读。

bugfixperformancekv-cache

#25407 Fix Mistral Large 3 nightly test

原始 PR · 作者 b8zhong · 合并时间 2026-05-16 08:28

缺陷修复重要性 4.54 洞察度 3.00

修复 Mistral Large 3 测试因 scale shape 不匹配失败

建议合并。该修复针对性强，改动极小且经过测试验证。可考虑在后续 PR 中增强切片安全性，例如对空 tensor 做 fallback 处理。

bugfixquanttest

#24944 Add multi-detokenizer support

原始 PR · 作者 yhyang201 · 合并时间 2026-05-16 08:26

功能重要性 8.64 洞察度 6.00

添加多 detokenizer 路由器与 CLI 参数

值得精读。该 PR 展示了如何在现有架构中插入一层无状态路由器以水平扩展 detokenizer，其设计模式（基于哈希的固定路由、进程生命周期管理、接口适配）具有参考价值。重点关注 `MultiDetokenizerRouter` 的路由策略和 `_extract_field_by_index` 的修复。

featuredeepseekinfra

#25103 [TRTLLM/SWA/Spec] fix trtllm mha + swa + spec accept length drop

原始 PR · 作者 hanming-lu · 合并时间 2026-05-16 08:15

缺陷修复重要性 5.73 洞察度 4.00

修复 TRTLLM SWA 推测解码接受长度异常

该 PR 是一个小但关键的 bugfix，修复了一个难以察觉的逻辑错误。建议精读，理解 draft/target 模型在混合 SWA 场景下如何共享内存池。值得关注的设计决策：判断依据从 allocator 类型改为 pool 类型，与 Triton 后端对齐。

bugfixspeculative-decodingblackwell

#24999 Add extension points on SpeculativeAlgorithm for custom spec v2

原始 PR · 作者 jasonjk-park · 合并时间 2026-05-16 06:45

重构重要性 6.84 洞察度 6.00

为自定义 speculative 算法提供扩展点

值得精读的设计模式改动。对于计划开发或集成自定义 speculative 算法的工程师，了解这两个扩展点是必须的。合并审批干净，CI 通过即可合入。建议后续为扩展点补充单元测试，确保新算法集成时不引入回归。

refactorspeculative-decodinginfra

第 120 / 357 页 · 共 2850 条

上一页 1 … 118 119 120 121 122 … 357 下一页