Prhub

sgl-project/sglang · 标签视图

标签列表

聚合结果

dependencies 相关 PR

2026-06-04

#21456 [CPU] upgrade dependent torch ver to PT2.12

原始 PR · 作者 ZailiWang · 合并时间 2026-06-04 11:04

基础设施 重要性 5.71 洞察度 4.00

升级 CPU 端 PyTorch 系列依赖至 2.12

建议 CPU 平台开发者和依赖管理者阅读该 PR,了解版本升级细节和适配方式。对于仅关注 GPU 的读者,此 PR 无直接参考价值。设计决策方面,迁移 AMX 查询到公开 API 是良好的版本兼容实践。

2026-06-03
2026-06-02
缺陷修复 重要性 6.64 洞察度 6.00

修复DeepGEMM runner中BF16 A2A和专家0遗漏

建议精读。该 PR 解决了实际运行中的关键问题,并展示了在 Triton kernel 中如何安全地提升数值精度(FP32 累积)。设计决策值得参考,尤其是条件量化路径的选择。如果团队在使用 DeepGEMM 运行时,建议尽快合并此 PR 并做回归验证。

2026-06-01
2026-05-31
重构 重要性 8.66 洞察度 4.00

将 allocator.py 拆分为 allocator/ 子包

该 PR 是模块拆分的最佳实践,适合关注代码组织和重构策略的开发者学习。它展示了如何在不破坏现有 API 的情况下逐步重构,并保留 Git 历史。推荐精读以了解子包拆分和向后兼容的导入模式。

2026-05-29

#26704 pin kernels<0.15

原始 PR · 作者 hnyls2002 · 合并时间 2026-05-29 16:46

缺陷修复 重要性 3.63 洞察度 2.00

限制 kernels 依赖版本 <0.15

此 PR 是必要的紧急修复,暂不涉及架构性设计。值得在后续版本中关注上游修复进展,并及时移除版本锁定。