Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 10:11 同步状态:空闲 下次计划:2026-06-07 11:11
后台正在同步并分析最近 PR,页面会自动刷新并逐步显示最新结果。

PR 列表

更多筛选
2026-05-02
基础设施 重要性 4.19 洞察度 2.00

升级 torch_memory_saver 并恢复 cu13 测试

值得合入。这是一个典型的依赖升级与测试恢复 PR,变更简洁明了。对于维护者而言,可以关注 `torch_memory_saver==0.0.9.post1` 在更广泛的 CUDA 版本上的稳定性,但就本 PR 而言风险已充分验证。

#24219 [diffusion] CI: change ground truth repo

原始 PR · 作者 mickqian · 合并时间 2026-05-02 12:25

基础设施 重要性 3.67 洞察度 2.00

切换扩散 CI ground truth 数据源仓库

变更简单直接,但建议确认 sgl-project/ci-data 仓库已包含所需数据且 CI 测试通过。对于了解项目 CI 基础设施演进的读者有一定参考价值。

缺陷修复 重要性 6.81 洞察度 4.00

修复 StreamingSession 释放时 mamba 池泄露

建议合并。该 PR 修复了一个明确的资源泄露问题,并且代码质量良好,遵循了已有的 `session_held_*` 模式。如果可能,后续可添加对应的单元测试,但并非阻塞条件。

功能 重要性 8.19 洞察度 6.00

支持RunAI流式加载量化检查点

值得精读。该 PR 涉及模型加载架构的重要扩展,特别是流式生成器模式、缓冲区管理策略(`_clone_if_runai_streamed_tensor`)以及路由设计中的防御性编程,对理解 SGLang 的加载器体系有参考价值。

功能 重要性 8.75 洞察度 6.00

升级 AI-Infra 技能包,替换 benchmark 并新增 incident triage 与分阶段 profiler 脚本

值得阅读以了解 SGLang 生态中 AI-Infra 技能包的架构和设计思路,尤其是跨框架 benchmark 配置校验和分阶段 profiler 的实现。建议后续跟进 review 中的文档改进建议。

缺陷修复 重要性 7.90 洞察度 6.00

修复 FLUX.2 NVFP4 在 B200 上的量化正确性

值得精读。关注 process_weights_after_loading 的条件化设计、per-GEMM z-score 调试方法。建议未来建立可配置命名映射机制。

功能 重要性 5.82 洞察度 4.00

新增NIXL后端参数环境变量配置

值得快速查看以了解 NIXL 后端的参数注入机制。若团队后续需支持更多后端参数,可考虑采用字典映射重构线程参数注入部分,但当前保持原样也合理。

参与讨论