Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 12:34 同步状态:空闲 下次计划:2026-06-07 13:34

PR 列表

更多筛选
2026-05-17
测试 重要性 3.56 洞察度 3.00

AMD CI 注册 EAGLE 约束解码测试

该 PR 变更简单,但体现了跨平台 CI 覆盖的重要实践:为 AMD 专用 runner 添加上游已有 CUDA 测试时,应根据实际运行时长合理调整 `est_time` 以优化 CI 分区。可快速合入。

测试 重要性 4.88 洞察度 5.00

AMD CI 注册 5 个框架测试,缩小覆盖差距

本 PR 虽为 CI 配置变更,但其筛选策略和 Reviewer 反馈处理的思路值得关注:1)通过关键字过滤排除硬件相关测试,避免虚假失败;2)对于平台特有差异,使用 skipIf(is_hip()) 精确跳过,而非全局禁用;3)坚持注册的测试必须可运行,避免注册即禁用。推荐 CI 维护者和跨平台贡献者阅读。

功能 重要性 8.92 洞察度 5.00

内存感知组件加载排序防OOM

值得精读。PR 展示了如何在不改变加载语义的前提下,通过纯排序解决资源竞争问题,并妥善处理与 FSDP 的交互。可关注 `order_component_load_specs` 的“inferred size + risk rank”双重排序策略,以及 `is_fsdp_managed_module` 的抽取模式。

#25506 [Doc] Fix several places for dpsk v4 cookbook

原始 PR · 作者 Fridge003 · 合并时间 2026-05-17 12:54

文档 重要性 5.50 洞察度 4.00

修复 DeepSeek V4 文档多处错误并新增 MegaMoE 说明

该 PR 为文档修复和功能补充,建议立即合并以修正已知问题并完善 MegaMoE 说明。值得关注的点:1) `isMegamoeUnsupported` 的设计与实际后端兼容性对齐;2) 文档格式审查流程。

#25497 Update kl_div_thres to 0.02 in swa_radix_cache

原始 PR · 作者 ch-wan · 合并时间 2026-05-17 07:43

测试 重要性 3.11 洞察度 2.00

调整 KL 散度测试阈值为 0.02

建议合并,但需要添加明确的动机说明(例如引用具体的 CI 失败链接或 KL 散度分布数据)。此外,删除冗余注释后代码更简洁。

缺陷修复 重要性 6.74 洞察度 5.00

回退 workspace buffer 初始化重构,修复残缺 wrappers 问题

建议立即跟进修复 `init_mha_chunk_metadata` 中的 `AttributeError`,在调用父类前增加 `hasattr(self, 'mha_chunk_kv_cache')` 检查或条件保护。长期而言,可重新设计 workspace 初始化方案,兼顾子类复用与父类完整性,但需确保所有代码路径下 wrapper 初始化完备。

参与讨论