Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 12:34 同步状态：空闲下次计划：2026-06-07 13:34

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-05-17

#25410 [Docs] Update DeepSeek V4 cookbook to use the latest docker image

原始 PR · 作者 zijiexia · 合并时间 2026-05-17 02:17

文档重要性 3.20 洞察度 1.00

DSV4 文档使用统一 Docker 镜像

可快速合并。建议验证 `latest` 镜像在多平台上的可用性。

documentationdeepseek

#24723 Delegate ModelExpress loading to package

原始 PR · 作者 zhengluo-nv · 合并时间 2026-05-17 02:16

重构重要性 9.00 洞察度 5.00

将ModelExpress加载委托给外部包

值得精读。此PR展示了如何通过委托外部包来大幅简化代码，同时保持清晰的集成表面。对于设计模块化系统、管理跨仓库依赖的团队有参考价值。特别是`loader.py`中从内部函数调用到外部类加载器的转变，以及`model_runner.py`中防止重复注册的条件逻辑，都是良好的设计模式。

refactorinfradocumentation

2026-05-16

#25477 [BugFix]: Fix DeepSeek V4 HiCache layer count logic

原始 PR · 作者 hzh0425 · 合并时间 2026-05-16 23:50

缺陷修复重要性 7.75 洞察度 5.00

修复 DeepSeek V4 HiCache 层计数逻辑并拆分测试 CI

此 PR 修复了关键的 PP + HiCache 兼容性问题，核心逻辑改动集中在层映射计算，值得精读以理解 PP 对缓存层的影响。同时应关注两个遗留风险：state pools 索引偏移和测试空覆盖，建议在后续 PR 中跟进修复。

bugfixhicachedeepseek

#24599 [codex] Split diffusion quant CI coverage

原始 PR · 作者 BBuf · 合并时间 2026-05-16 22:05

基础设施重要性 4.84 洞察度 4.00

拆分 diffusion 量化 CI 为 FP8 和 B200 两套测试

值得阅读，尤其是了解如何通过简单的配置拆分优化 CI 硬件利用率。建议关注 `gpu_cases.py` 中列表定义的模式，以及 `diffusion_case_parser.py` 中分区映射的写法，这种模式可以在其他需要硬件隔离的测试场景中复用。

diffusionquantci

#25411 [diffusion] Default Qwen Image VAE precision to bf16

原始 PR · 作者 qimcis · 合并时间 2026-05-16 21:55

功能重要性 5.84 洞察度 5.00

扩散模型 VAE 默认精度改为 bf16

该 PR 质量良好，数据充分，值得合并。建议精读 MOVA 的 AMD 编译错误修复，理解 AMD 平台上的兼容性限制，并在未来引入类似精度优化时注意测试 AMD CI。

diffusionfeatureperformance

#24732 [codex] Optimize LTX2 split rotary kernel

原始 PR · 作者 BBuf · 合并时间 2026-05-16 20:58

性能优化重要性 5.84 洞察度 6.00

优化 LTX2 分裂 RoPE Triton 内核，合并多个 head 的 launch grid

该 PR 值得精读，尤其对需要优化 Triton kernel 以利用 GPU 的开发者。核心设计决策是使用程序块合并多个 head，这是一种常见的 GPU 优化模式（减少 program 数量，增加每个 program 的工作量以更好地隐藏延迟）。自适应 warp 数量的选择也值得参考。建议在合并到主分支前，确认其他 GPU 架构（如 A100）的基准测试结果。

performancejit-kerneldiffusion

#25476 fix(pd): tolerate kv pools without end_layer (Qwen3-Next disagg)

原始 PR · 作者 whybeyoung · 合并时间 2026-05-16 19:49

缺陷修复重要性 5.05 洞察度 2.00

修复 Qwen3-Next 分离部署中 KV pool 缺少 end_layer 属性导致的崩溃

此 PR 是必须的快速修复，改动虽小但影响关键路径。建议阅读以了解类似模式的使用（getattr 防御性访问），未来在定义 KV pool 接口时注意统一属性契约。

bugfixdeepseekkv-cache

#25475 pr-states: workflow_dispatch refresh on slash cmds

原始 PR · 作者 hnyls2002 · 合并时间 2026-05-16 18:34

基础设施重要性 4.63 洞察度 5.00

PR states 工作流支持 workflow_dispatch 刷新

该 PR 是纯基础设施改进，逻辑清晰、改动适度，值得合并。建议后续 PR 处理 review 中未解决的改进建议（默认分支动态获取、覆盖 `handle_rerun_test`），它们可进一步提升健壮性和覆盖率。

infraci

第 115 / 357 页 · 共 2850 条

上一页 1 … 113 114 115 116 117 … 357 下一页