Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 12:34 同步状态:空闲 下次计划:2026-06-07 13:34

PR 列表

更多筛选
2026-05-16
缺陷修复 重要性 8.82 洞察度 6.00

修复 HiCache 下 UnifiedRadixCache 的设备匹配语义

建议精读,尤其是设计模式:如何在一个匹配过程中同时跟踪 best host match 和 best device match。`create_match_validator` 的参数化设计值得借鉴。如果团队正在开发缓存层或类似的分层匹配系统,此 PR 提供了清晰的参考实现。

2026-05-15

#25399 Add NPU condition for cosine and sine caching

原始 PR · 作者 ch-wan · 合并时间 2026-05-15 20:21

性能优化 重要性 5.09 洞察度 3.00

NPU 条件化缓存 cos/sin 节省约 230MB

该 PR 属于性能微优化,变更简单直接,适合快速合并。可关注 review 中的优化建议,在后续迭代中进一步减少冗余计算。

#25264 move runs_on + rdma into runner_configs.yml

原始 PR · 作者 hnyls2002 · 合并时间 2026-05-15 19:19

基础设施 重要性 5.39 洞察度 4.00

将 runs_on 和 rdma 移入 runner_configs.yml

该 PR 值得 CI 相关开发者精读,展示了如何通过 CLI 脚本 + YAML 配置统一管理 GitHub Actions 的多维度参数(安装、标签、RDMA)。设计上采用双模式分离职责,并利用 `$GITHUB_OUTPUT` 传递结构化数据,是 CI 配置中心化的良好范例。

缺陷修复 重要性 7.34 洞察度 6.00

修复 Cache-DiT 挂载与 torch.compile 的顺序问题

建议合并。PR 定位清晰、改动简洁、性能收益显著,且已获得 reviewer 批准。值得关注的设计决策是将编译延迟到 Cache-DiT 挂载之后的方法定义,以及使用模块 id 集合避免重复编译的做法。

#25080 Fix incorrect import in test case

原始 PR · 作者 liuxianglong17 · 合并时间 2026-05-15 17:35

缺陷修复 重要性 3.54 洞察度 1.00

修复 NPU 测试文件中的错误导入路径

建议合并。这是一个简单的导入路径修复,不影响其他功能。开发者应确保测试文件中使用的导入路径与项目实际模块结构一致。

基础设施 重要性 6.29 洞察度 5.00

废弃 /rerun-stage 并清理 target_stage 基础设施

建议阅读该 PR 以了解如何基于使用数据做出废弃决策,以及如何清理跨多个工作流的死代码。特别值得关注的是 `_pr-test-check-changes.yml` 中移除 API 驱动的变化检测步骤,这显著简化了工作流。

参与讨论