在cookbook中更新Xeon CPU支持信息
建议阅读该 PR,特别是 `disabledWhen` 和 `condition()` 的设计模式,展示了如何优雅地组织硬件依赖的 UI 选项。同时注意交叉检查多个模型页面的一致性,确保命令参数的准确性。
标签列表
聚合结果
在cookbook中更新Xeon CPU支持信息
建议阅读该 PR,特别是 `disabledWhen` 和 `condition()` 的设计模式,展示了如何优雅地组织硬件依赖的 UI 选项。同时注意交叉检查多个模型页面的一致性,确保命令参数的准确性。
升级 CPU 端 PyTorch 系列依赖至 2.12
建议 CPU 平台开发者和依赖管理者阅读该 PR,了解版本升级细节和适配方式。对于仅关注 GPU 的读者,此 PR 无直接参考价值。设计决策方面,迁移 AMX 查询到公开 API 是良好的版本兼容实践。
显式启用 x86_64 的 AVX512/AMX 指令集
该 PR 值得阅读,它展示了在构建系统中如何处理指令集兼容性。对于维护者,需要确认发布二进制是否包含这些指令集,以及对旧硬件的策略;对于使用 CPU 后端的用户,建议验证目标 CPU 的指令集支持。
修复 CPU 核中 b_ptr 索引错误
建议尽快合并。该修复为明确的 bugfix,且已有充分测试验证。对于关注 CPU 推理性能的团队值得关注。
为CPU添加GPT-OSS模型优化支持
值得精读,尤其是MoE kernel中bias和swiglu融合的设计方式、flash_attn逐行处理以支持sliding window的取舍,以及测试重构(@parametrize)模式。建议关注MXFP4路径的后续性能基准测试。
原始 PR · 作者 chunyuan-w · 合并时间 2026-05-28 10:53
修复 MiniMax-M2.7 在 CPU 上的运行问题
该 PR 值得合并,它解决了特定模型的 CPU 兼容性,且改动集中、设计合理。建议关注作者创建的 issue #26439 以跟踪后续优化(如融合 all-reduce、增加 CPU kernel 支持)。Review 中关于类型转换隐藏和条件精度的做法值得借鉴。
增强 Intel Xeon CPU CI 稳定性和测试覆盖
该 PR 显著提升了 Xeon CI 的可靠性和覆盖范围,设计合理,讨论中的问题均已澄清或解决。建议合并,并考虑后续将 `HF_TOKEN` 迁移至 GitHub Secrets 以增强安全性。
为 CPU 添加 Qwen3-VL / Omni 前端支持
值得详细阅读。代码设计体现了对异构硬件后端(CPU AMX)的良好抽象(通过 `QKV_BACKEND_IMPL` 字典),并且在 Review 中展现了在性能与代码干净度之间权衡的典型过程(移除 hack、defer 性能问题)。为后续多模态模型 CPU 支持提供了模板。