Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 10:11 同步状态:空闲 下次计划:2026-06-07 11:11
后台正在同步并分析最近 PR,页面会自动刷新并逐步显示最新结果。

PR 列表

更多筛选
2026-04-30
缺陷修复 重要性 6.59 洞察度 6.00

修复 Qwen3-Next FP8 量化加载错误

该 PR 值得精读,因为它展示了 FP8 量化配置中 `modules_to_not_convert` 与融合层映射的微妙交互,以及回归问题的诊断过程。测试文件的设计清晰且具有代表性,可作为类似场景的测试模板。

#21062 Use spec v2 by default

原始 PR · 作者 Qiaolin-Yu · 合并时间 2026-04-30 04:40

功能 重要性 8.34 洞察度 5.00

默认启用 spec v2 推测解码

该 PR 值得仔细阅读,特别是 `server_args.py` 中默认逻辑的设计和测试用例的配套调整。展示了如何将一个实验性特性平稳切换为默认,同时保留回退路径。对于使用推测解码的开发者,应了解新的默认行为和降级条件。推荐关注后续是否有针对 topk>1 支持的 PR。

#23105 feat: Support modelexpress p2p RDMA transfer

原始 PR · 作者 AndyDai-nv · 合并时间 2026-04-30 03:57

功能 重要性 8.66 洞察度 7.00

为 ModelExpress 添加 NIXL RDMA 传输后端

值得精读:展示了传输层抽象(通过 `transport` 配置分支)和数据契约(`WorkerMetadata` 的 oneof 设计)。建议合并后尽快补充 NIXL 路径的 CI 集成测试,以及验证不同量化模型的张量布局一致性。

参与讨论