Prhub

sgl-project/sglang · 标签视图

标签列表

聚合结果

cpu 相关 PR

2026-06-06
文档 重要性 7.02 洞察度 5.00

在cookbook中更新Xeon CPU支持信息

建议阅读该 PR,特别是 `disabledWhen` 和 `condition()` 的设计模式,展示了如何优雅地组织硬件依赖的 UI 选项。同时注意交叉检查多个模型页面的一致性,确保命令参数的准确性。

2026-06-04

#21456 [CPU] upgrade dependent torch ver to PT2.12

原始 PR · 作者 ZailiWang · 合并时间 2026-06-04 11:04

基础设施 重要性 5.71 洞察度 4.00

升级 CPU 端 PyTorch 系列依赖至 2.12

建议 CPU 平台开发者和依赖管理者阅读该 PR,了解版本升级细节和适配方式。对于仅关注 GPU 的读者,此 PR 无直接参考价值。设计决策方面,迁移 AMX 查询到公开 API 是良好的版本兼容实践。

2026-06-03
性能优化 重要性 3.76 洞察度 3.00

显式启用 x86_64 的 AVX512/AMX 指令集

该 PR 值得阅读,它展示了在构建系统中如何处理指令集兼容性。对于维护者,需要确认发布二进制是否包含这些指令集,以及对旧硬件的策略;对于使用 CPU 后端的用户,建议验证目标 CPU 的指令集支持。

2026-05-29

#16775 [CPU] Add GPT-OSS model optimization for CPU

原始 PR · 作者 blzheng · 合并时间 2026-05-29 16:05

功能 重要性 8.41 洞察度 5.00

为CPU添加GPT-OSS模型优化支持

值得精读,尤其是MoE kernel中bias和swiglu融合的设计方式、flash_attn逐行处理以支持sliding window的取舍,以及测试重构(@parametrize)模式。建议关注MXFP4路径的后续性能基准测试。

2026-05-28

#25061 Fix MiniMax-M2.7 on CPU

原始 PR · 作者 chunyuan-w · 合并时间 2026-05-28 10:53

缺陷修复 重要性 6.90 洞察度 5.00

修复 MiniMax-M2.7 在 CPU 上的运行问题

该 PR 值得合并,它解决了特定模型的 CPU 兼容性,且改动集中、设计合理。建议关注作者创建的 issue #26439 以跟踪后续优化(如融合 all-reduce、增加 CPU kernel 支持)。Review 中关于类型转换隐藏和条件精度的做法值得借鉴。

基础设施 重要性 5.08 洞察度 4.00

增强 Intel Xeon CPU CI 稳定性和测试覆盖

该 PR 显著提升了 Xeon CI 的可靠性和覆盖范围,设计合理,讨论中的问题均已澄清或解决。建议合并,并考虑后续将 `HF_TOKEN` 迁移至 GitHub Secrets 以增强安全性。

2026-05-27

#12662 [CPU] Add support for Qwen3-vl and Qwen3-omni

原始 PR · 作者 blzheng · 合并时间 2026-05-27 08:56

功能 重要性 8.51 洞察度 6.00

为 CPU 添加 Qwen3-VL / Omni 前端支持

值得详细阅读。代码设计体现了对异构硬件后端(CPU AMX)的良好抽象(通过 `QKV_BACKEND_IMPL` 字典),并且在 Review 中展现了在性能与代码干净度之间权衡的典型过程(移除 hack、defer 性能问题)。为后续多模态模型 CPU 支持提供了模板。