Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 12:34 同步状态：空闲下次计划：2026-06-07 13:34

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-05-14

#24277 [HiCache] enable ssd offload support for mooncake store

原始 PR · 作者 stmatengss · 合并时间 2026-05-14 14:07

功能重要性 6.27 洞察度 6.00

为 Mooncake 存储后端添加 SSD 卸载支持

建议读者关注其中向后兼容的 try-except 降级处理模式，这种为可选新功能安全适配旧版本的方法在成熟项目中很有价值。同时，由于缺少单元测试对降级路径的覆盖，建议在 future 工作中补充。

hicachefeaturedocumentation

#25236 ci: H200 conditional split + dsv4 est_time recalibration (h200 partition 6→2)

原始 PR · 作者 alisonshao · 合并时间 2026-05-14 13:28

基础设施重要性 4.29 洞察度 3.00

H200 8-GPU 测试分区从 6 缩减至 2，5 个测试移至 nightly

值得快速合并，是持续降低 CI 等待时间的有效迭代。建议后续关注夜间测试稳定性，并考虑将此类测试进一步迁移至 merge-queue 机制（如 PR body 所述）。

ciinfraperformance

#25088 [UnifiedRadixCache] Fix HiCache load back start node

原始 PR · 作者 ispobock · 合并时间 2026-05-14 13:18

缺陷修复重要性 7.69 洞察度 6.00

统一 HiCache L2 load-back 锚点到 best_match_node，修复高并发 worker crash

该 PR 是核心 bugfix，强烈建议所有启用 HiCache 的用户升级。值得精读源码中的 Full 组件锁跳过 evicted 段的设计模式，以及 SWA 组件如何利用 best_match_node 保证 walk 不越界。测试用例的 setup 函数也展示了复杂的树结构构建技巧，对理解 HiCache 测试有帮助。

hicachebugfixkv-cache

#25046 [Rerank] Early-exit logprob scan and hoist math import

原始 PR · 作者 tjdharamsi · 合并时间 2026-05-14 13:01

性能优化重要性 5.56 洞察度 3.00

提前退出 logprob 扫描并提升 math 导入

值得合并。这是一个干净、低风险且易于理解的性能优化。可以精读 `_extract_score_from_logprobs` 方法以了解 Qwen3-VL 重排序的分数提取逻辑。

performancerefactor

#24717 LFM2: pass has_initial_state to causal_conv1d_fn for prefill

原始 PR · 作者 tugot17 · 合并时间 2026-05-14 12:57

缺陷修复重要性 5.94 洞察度 5.00

修复 LFM2 短卷积预填充状态污染

值得精读，展示了状态管理类 bug 的典型修复思路。可关注与 #23975 的关联，理解完整的修复链条。

bugfixmambakv-cache

#25232 ci: emit machine-readable TIMINGS block at end of run_unittest_files

原始 PR · 作者 hnyls2002 · 合并时间 2026-05-14 12:56

基础设施重要性 5.25 洞察度 3.00

CI 测试框架输出机器可读 TIMINGS 块

作为 CI 基础设施改进，值得合并。后续可基于 TIMINGS 块构建更丰富的可视化或监控面板。新引入的 `_repo_relative_path` 函数可被其他需要稳定文件路径的模块复用。

ciinfratest

#25138 ci: extract cuda stage actions + runner_config mapping

原始 PR · 作者 hnyls2002 · 合并时间 2026-05-14 12:16

基础设施重要性 6.14 洞察度 5.00

提取 CUDA stage 为可重用工作流，统一 runner_config 映射

建议 CI 相关团队阅读，可参考其如何通过可重用工作流和外部映射文件大规模裁剪 CI 配置冗余。整体设计清晰，等价性验证方法值得借鉴。

ciinfrarefactor

#25064 [Bug Fix] Add priority property to DecodeRequest to fix AttributeError with --enable-priority-scheduling

原始 PR · 作者 Kare0638 · 合并时间 2026-05-14 11:54

缺陷修复重要性 5.67 洞察度 5.00

修复 DecodeRequest 缺少 priority 属性导致的崩溃

值得精读，因为：1. 示例了数据类代理属性的标准做法；2. 展示了跨模块调用在分离模式下的属性缺失 bug 模式；3. 代码变更虽小但修复了关键路径的崩溃。后续可考虑为 DecodeRequest 添加单元测试，验证所有委托属性都与 Req 同步。

bugfixschedulingtest

第 129 / 357 页 · 共 2850 条

上一页 1 … 127 128 129 130 131 … 357 下一页