Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 12:34 同步状态:空闲 下次计划:2026-06-07 13:34

PR 列表

更多筛选
2026-05-22

#26042 update npu codeowners

原始 PR · 作者 whybeyoung · 合并时间 2026-05-22 11:46

基础设施 重要性 2.68 洞察度 2.00

更新 NPU 相关目录的 CODEOWNERS

建议合并,但作者应确认是否需要将 @whybeyoung 同时添加到 quantization 路径,以及 platforms 目录的所有权是否过于宽泛。

#25661 [diffusion] model: support FLUX.2-klein-base

原始 PR · 作者 alex0dd · 合并时间 2026-05-22 11:24

功能 重要性 7.20 洞察度 4.00

支持 FLUX.2-klein-base 未蒸馏模型,启用 CFG 和 negative prompts

该 PR 实现清晰,适合快速合并。建议关注其后的扩散模型 PR 以了解 FLUX 系列支持的演进。

#23220 Bugfix: Qwen3-VL-MoE adapt encoder_only

原始 PR · 作者 Hide-on-bushsh · 合并时间 2026-05-22 11:12

缺陷修复 重要性 4.90 洞察度 2.00

修复 Qwen3-VL-MoE encoder-only 模式启动失败

建议尽快合并此修复。改动简单且安全,能够解决特定场景的服务阻塞问题。未来应考虑为 encoder-only 模式添加单元测试,覆盖模型加载路径。

#26034 Fix SMG service discovery Clippy lint

原始 PR · 作者 mmangkad · 合并时间 2026-05-22 10:51

缺陷修复 重要性 5.20 洞察度 2.00

修复 SMG 服务发现 Clippy 警告

可直接合并。代码量小、改动清晰,且已通过 CI 验证。

缺陷修复 重要性 6.84 洞察度 5.00

多模态数据加载改为非阻塞,修复健康检查卡死

建议精读本 PR,特别是 base_processor.py 中的异步转换模式,可作为类似 event loop 阻塞修复的参考。注意:未来新增子处理器时,需确保调用 await self.load_mm_data()。

参与讨论