Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-13 17:27 同步状态:空闲 下次计划:2026-06-13 18:27

PR 列表

更多筛选
2026-05-14
基础设施 重要性 5.24 洞察度 5.00

将 9 个独立输入打包为 2 个 JSON 输入,简化 CI 工作流调用

值得阅读。该 PR 展示了 GitHub Actions 工作流中通过 JSON 打包输入来简化多参数传递的设计模式,同时提供了验证等价性的方法。适合负责 CI 维护的工程师参考。

基础设施 重要性 5.84 洞察度 4.00

CI 脚本改为集中 model.json 数据源

建议 CI 相关开发者阅读此 PR,理解集中式数据源的设计思路——将不同工具的统计模型统一从 `sglang-ci-stats` 获取,消除重复抓取和数据不一致。关注 `fetch_model` 的容错策略和边界条件的处理方式。

ROCm NSA indexer 自动回退 page_size=1 以兼容低版本 Triton

值得关注的设计包括:运行时能力检测与优雅降级模式;通过 `@lru_cache` 避免重复检测;使用独立环境变量提供紧急逃生通道(`SGLANG_NSA_HIP_DISABLE_PRESHUFFLE`);以及在 `server_args.py` 中用延迟导入打破循环依赖的技巧。

缺陷修复 重要性 5.05 洞察度 5.00

修复新式 register_cuda_ci 不被识别

建议合并后关注后续是否有遗漏的新式参数变体(如参数顺序不一致),可考虑未来将 `_extract_suite` 进一步抽象为更通用的参数解析器。此 PR 适合 CI/Infra 团队精读,对理解 CI 注册机制的演进有参考价值。

参与讨论