CI 脚本自愈 Runner 文件命令目录丢失
建议合并。修复了已知的间歇性 CI 故障,改动小而安全。
SGLang is a high-performance serving framework for large language models and multimodal models.
CI 脚本自愈 Runner 文件命令目录丢失
建议合并。修复了已知的间歇性 CI 故障,改动小而安全。
原始 PR · 作者 whybeyoung · 合并时间 2026-05-22 11:46
更新 NPU 相关目录的 CODEOWNERS
建议合并,但作者应确认是否需要将 @whybeyoung 同时添加到 quantization 路径,以及 platforms 目录的所有权是否过于宽泛。
支持 FLUX.2-klein-base 未蒸馏模型,启用 CFG 和 negative prompts
该 PR 实现清晰,适合快速合并。建议关注其后的扩散模型 PR 以了解 FLUX 系列支持的演进。
路由非推测 seq_lens 至 FutureMap,统一跨模式处理
建议阅读以理解 FutureMap 在调度中的统一设计,特别是 invalidate 和 resolve_future 的对称关系。配合下一步 #26020 可了解完整演进方向。
原始 PR · 作者 Hide-on-bushsh · 合并时间 2026-05-22 11:12
修复 Qwen3-VL-MoE encoder-only 模式启动失败
建议尽快合并此修复。改动简单且安全,能够解决特定场景的服务阻塞问题。未来应考虑为 encoder-only 模式添加单元测试,覆盖模型加载路径。
修复 SMG 服务发现 Clippy 警告
可直接合并。代码量小、改动清晰,且已通过 CI 验证。
修复 PR CI 取消工作流的漏洞,覆盖关闭未合并和工作流不完整
对于 CI 维护者值得精读,特别是 `maybe_cancel_for_pr` 函数的处理逻辑和 `gh run list --status` 的使用。
多模态数据加载改为非阻塞,修复健康检查卡死
建议精读本 PR,特别是 base_processor.py 中的异步转换模式,可作为类似 event loop 阻塞修复的参考。注意:未来新增子处理器时,需确保调用 await self.load_mm_data()。
参与讨论