Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 12:34 同步状态:空闲 下次计划:2026-06-07 13:34
后台正在同步并分析最近 PR,页面会自动刷新并逐步显示最新结果。

PR 列表

更多筛选
2026-05-14
基础设施 重要性 5.25 洞察度 3.00

CI 测试框架输出机器可读 TIMINGS 块

作为 CI 基础设施改进,值得合并。后续可基于 TIMINGS 块构建更丰富的可视化或监控面板。新引入的 `_repo_relative_path` 函数可被其他需要稳定文件路径的模块复用。

基础设施 重要性 6.14 洞察度 5.00

提取 CUDA stage 为可重用工作流,统一 runner_config 映射

建议 CI 相关团队阅读,可参考其如何通过可重用工作流和外部映射文件大规模裁剪 CI 配置冗余。整体设计清晰,等价性验证方法值得借鉴。

缺陷修复 重要性 5.67 洞察度 5.00

修复 DecodeRequest 缺少 priority 属性导致的崩溃

值得精读,因为:1. 示例了数据类代理属性的标准做法;2. 展示了跨模块调用在分离模式下的属性缺失 bug 模式;3. 代码变更虽小但修复了关键路径的崩溃。后续可考虑为 DecodeRequest 添加单元测试,验证所有委托属性都与 Req 同步。

文档 重要性 5.25 洞察度 2.00

新增 Ascend NPU 精度评估与 FAQ 文档

可直接合并。建议 NPU 用户精读精度评估文档以了解推荐流程,一线支持人员参考 FAQ 快速定位问题。后续可补充更多场景的 FAQ 条目。

基础设施 重要性 6.42 洞察度 6.00

合并 H200 8-GPU 预热步骤并统一日志输出

值得精读,展示 CI 优化的典型思路:识别非持久化工作(CUDA graphs)、利用持久化缓存(DeepGEMM JIT cache)、精确匹配启动参数(FALLBACK_ARGS)、处理孤儿进程。标记文件实现和版本键设计可作为类似场景的参考。

测试 重要性 8.48 洞察度 5.00

跨命名空间、生命周期、多模型 K8s 集成测试

值得精读,尤其是测试设计中的以下决策: - 使用独占标签(如 `cross-ns-test=true`、`lifecycle=restart`)隔离不同测试的 worker 池,避免跨文件干扰。 - 在 IP 变化测试中优雅处理 CNI IP 重用场景,通过 skip 而非 false-pass。 - 优雅排空测试验证 `elapsed < grace_secs`,确保 deregistration 在 deletionTimestamp 触发而非等到 Pod 完全终止。 这些模式可以复用到底层 sglang 或其他微服务的集成测试中。

缺陷修复 重要性 8.46 洞察度 5.00

修复 PD 模式下 cache-aware 策略池隔离 bug

对于使用 sgl-model-gateway 且启用 PD 模式 + cache-aware 路由策略的团队,此 PR 必须合入以解决缓存路由失效问题。其设计决策(复合键隔离、独立策略实例)值得在高可用路由设计时参考。审查者可以重点关注 `cache_aware.rs` 中的键构造函数和 `registry.rs` 中的分发逻辑。

参与讨论