Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 10:11 同步状态:空闲 下次计划:2026-06-07 11:11
后台正在同步并分析最近 PR,页面会自动刷新并逐步显示最新结果。

PR 列表

更多筛选
2026-06-01
缺陷修复 重要性 7.73 洞察度 5.00

修复权重检查器零维张量与多GPU支持

建议团队成员特别是部署运维人员阅读此 PR,了解 weights_checker 的新用法和潜在风险。对于分布式调试非常有用。关注 review 中提出的 deadlock 问题,确保实际部署环境中的进程模型匹配。

功能 重要性 6.51 洞察度 5.00

扩散测试采样参数自动推断,移除冗余参数

建议扩散测试相关开发者精读 `testcase_configs.py` 中的新增函数,理解推断逻辑。该 PR 的设计模式(通过 task type 自动选择参数模板)值得在其他类似需要多配置的测试场景中复制。同时注意后续新增模型时检查推断映射是否覆盖。

缺陷修复 重要性 4.86 洞察度 3.00

修复 NPU 夜间测试因超时失败

值得快速合入,属于典型的 CI 稳定性修复。关注其中 RPC 套接字关闭模式(`linger=0` + `getattr` 保护),可作为其他 `shutdown` 场景的参考模式。

重构 重要性 6.59 洞察度 5.00

使 spec_v2 中 mla 的 seq_lens_cpu 可选以消除 D2H 同步

该 PR 值得精读,因为它展示了如何通过简单的标志位避免不必要的同步,以提高推测解码性能。设计上的权衡——用预分配的掩码缓冲区换取跳过同步——是典型的 GPU 编程优化模式。建议关注其与上层框架(如 `decide_needs_cpu_seq_lens`)的集成点。

参与讨论