修复 HiCache 下 UnifiedRadixCache 的设备匹配语义
建议精读,尤其是设计模式:如何在一个匹配过程中同时跟踪 best host match 和 best device match。`create_match_validator` 的参数化设计值得借鉴。如果团队正在开发缓存层或类似的分层匹配系统,此 PR 提供了清晰的参考实现。
SGLang is a high-performance serving framework for large language models and multimodal models.
修复 HiCache 下 UnifiedRadixCache 的设备匹配语义
建议精读,尤其是设计模式:如何在一个匹配过程中同时跟踪 best host match 和 best device match。`create_match_validator` 的参数化设计值得借鉴。如果团队正在开发缓存层或类似的分层匹配系统,此 PR 提供了清晰的参考实现。
NPU 条件化缓存 cos/sin 节省约 230MB
该 PR 属于性能微优化,变更简单直接,适合快速合并。可关注 review 中的优化建议,在后续迭代中进一步减少冗余计算。
将 runs_on 和 rdma 移入 runner_configs.yml
该 PR 值得 CI 相关开发者精读,展示了如何通过 CLI 脚本 + YAML 配置统一管理 GitHub Actions 的多维度参数(安装、标签、RDMA)。设计上采用双模式分离职责,并利用 `$GITHUB_OUTPUT` 传递结构化数据,是 CI 配置中心化的良好范例。
修复 fork PR token 与 run-ci 标签感知
可快速合入,提升 fork PR 贡献者体验;拉取 review 时重点确认触发器改动和标签逻辑正确性。
PR awareness 独立 workflow,降低 pulls:write 传播
值得精读,尤其是独立工作流模式、重试策略和权限最小化设计。对于希望优化 CI 安全及解耦的团队有参考价值。
修复 Cache-DiT 挂载与 torch.compile 的顺序问题
建议合并。PR 定位清晰、改动简洁、性能收益显著,且已获得 reviewer 批准。值得关注的设计决策是将编译延迟到 Cache-DiT 挂载之后的方法定义,以及使用模块 id 集合避免重复编译的做法。
原始 PR · 作者 liuxianglong17 · 合并时间 2026-05-15 17:35
修复 NPU 测试文件中的错误导入路径
建议合并。这是一个简单的导入路径修复,不影响其他功能。开发者应确保测试文件中使用的导入路径与项目实际模块结构一致。
废弃 /rerun-stage 并清理 target_stage 基础设施
建议阅读该 PR 以了解如何基于使用数据做出废弃决策,以及如何清理跨多个工作流的死代码。特别值得关注的是 `_pr-test-check-changes.yml` 中移除 API 驱动的变化检测步骤,这显著简化了工作流。
参与讨论