Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 12:34 同步状态:空闲 下次计划:2026-06-07 13:34

PR 列表

更多筛选
2026-05-14

ROCm NSA indexer 自动回退 page_size=1 以兼容低版本 Triton

值得关注的设计包括:运行时能力检测与优雅降级模式;通过 `@lru_cache` 避免重复检测;使用独立环境变量提供紧急逃生通道(`SGLANG_NSA_HIP_DISABLE_PRESHUFFLE`);以及在 `server_args.py` 中用延迟导入打破循环依赖的技巧。

缺陷修复 重要性 5.05 洞察度 5.00

修复新式 register_cuda_ci 不被识别

建议合并后关注后续是否有遗漏的新式参数变体(如参数顺序不一致),可考虑未来将 `_extract_suite` 进一步抽象为更通用的参数解析器。此 PR 适合 CI/Infra 团队精读,对理解 CI 注册机制的演进有参考价值。

文档 重要性 4.99 洞察度 3.00

为 DSv4 文档添加 H100 部署选项和 Docker 镜像

建议快速合入。该 PR 是纯文档和数据展示层面的更新,逻辑清晰、改动集中,且已通过 review。对于文档类 PR 而言,这是一个规范的样例。

缺陷修复 重要性 5.75 洞察度 4.00

修复 NPU 上 Qwen2-VL 图像预处理与 GDN 闪退兼容性问题

建议阅读以了解 NPU 后端如何适配上游库变更,但该 PR 变更较小,团队可快速合并。后续应补充测试用例以确保预处理补丁的兼容性。

参与讨论