Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 10:11 同步状态:空闲 下次计划:2026-06-07 11:11
后台正在同步并分析最近 PR,页面会自动刷新并逐步显示最新结果。

PR 列表

更多筛选
2026-05-01

#23811 [Feature] Xiaomi MiMo-V2.5 day0 support

原始 PR · 作者 Abatom · 合并时间 2026-05-01 00:02

功能 重要性 9.18 洞察度 6.00

为Xiaomi MiMo-V2.5添加多模态与EAGLE推测解码支持

此 PR 是小米模型的完整集成,值得详细审阅,特别是 fused-qkv 装载模式、多模态处理器设计以及 VisionAttention 增强。合并后应关注 Gemma4 和其他多模态模型的回归测试。

2026-04-30

#24155 [AMD] Nightly image release for deepseek v4

原始 PR · 作者 yctseng0211 · 合并时间 2026-04-30 23:49

基础设施 重要性 4.81 洞察度 2.00

添加DeepSeek V4 AMD夜间镜像发布

这是一次纯粹的CI/CD配置变更,对于非AMD平台的工程师可忽略。但AMD团队应关注构建成功率,并考虑添加构建后的测试验证步骤。

缺陷修复 重要性 6.99 洞察度 5.00

修复NPU OffloaderV2的meta和sharded_gpu模式兼容问题

该PR虽是bugfix但涉及offloader核心路径和NPU后端的关键操作,值得相关维护者精读。'_move_param_to_meta' 中的weight_loader补全和NPU格式转换的meta跳过是两个值得注意的设计决策,体现了对框架参数迁移和异构设备支持的深入理解。

重构 重要性 9.18 洞察度 8.00

重构AWQ量化模块,拆解为scheme结构并分离后端内核

**值得精读**。该 PR 展示了如何将庞大历史遗留模块拆解为 scheme + kernel 的干净架构,其设计思路可以借鉴到其他量化方法(如 GPTQ、FP8)甚至非量化的模型层。重点关注 `get_quant_method` 的分派逻辑、`_init_kernel` 钩子模式以及 hardware_backend 的隔离策略。

缺陷修复 重要性 4.35 洞察度 2.00

修复边界条件,允许总 token 数等于 context_len 的请求

可以快速合并。变更简单安全,建议添加单元测试覆盖边界情况以确保未来重构时不会回归。

参与讨论