#26731 [NPU] Update documentation for software version upgrades
原始 PR · 作者 OrangeRedeng · 合并时间 2026-06-06 20:06
更新 NPU 文档与 CI/Docker 配置以支持软件版本升级
该 PR 属于常规文档和配置更新,无需要重点关注的技术决策。NPU 相关开发者和用户可阅读了解最新版本要求。
标签列表
聚合结果
原始 PR · 作者 OrangeRedeng · 合并时间 2026-06-06 20:06
更新 NPU 文档与 CI/Docker 配置以支持软件版本升级
该 PR 属于常规文档和配置更新,无需要重点关注的技术决策。NPU 相关开发者和用户可阅读了解最新版本要求。
原始 PR · 作者 EduardDurech · 合并时间 2026-06-06 15:04
新增 Apertus2509 工具调用与推理块解析器
该 PR 设计思路清晰,遵循了现有解析器框架的扩展模式,是添加新模型格式的良好范例。建议阅读 `apertus2509_detector.py` 和 `reasoning_parser.py` 的源码,了解如何集成 tool call 与 reasoning 解析。对于需要支持相似自定义格式的开发者,该 PR 提供了可复用的模式。
在cookbook中更新Xeon CPU支持信息
建议阅读该 PR,特别是 `disabledWhen` 和 `condition()` 的设计模式,展示了如何优雅地组织硬件依赖的 UI 选项。同时注意交叉检查多个模型页面的一致性,确保命令参数的准确性。
在 cookbook 首页添加腾讯混元与 Poolside 卡片
建议合并。改动清晰、已验证链接可用,仅需确认 Logo 版权无争议。无需精读。
为 Gemma 4 部署交互文档新增 QAT 检查点支持
建议合入。这是一个低风险、高收益的文档更新,通过交互式组件降低了用户使用 QAT 检查点的门槛,符合 SGLang 持续丰富模型部署指南的方向。
更新 Qwen3-Next-80B-A3B 的 NPU 最佳实践文档
该 PR 内容清晰,文档质量较好,推荐用户参考其中的配置部署 Qwen3-Next-80B-A3B 模型。后续可关注 `SGLANG_ENABLE_TP_MEMORY_INBALANCE_CHECK` 拼写是否修正,避免用户误用。
原始 PR · 作者 Hide-on-bushsh · 合并时间 2026-06-05 14:27
新增 GLM 模型 NPU 最佳实践文档,修复链接和路径
对于在 Ascend NPU 上部署 GLM 模型的用户,本 PR 提供的文档具有直接参考价值。对于文档维护者,可以关注 review 中对锚点 slug 化处理和硬编码路径替换的讨论,作为文档编写最佳实践。建议合并后对锚点链接进行自动化校验,防止未来因渲染规则变化导致失效。
同步遗留文档至 Mintlify 站点
本 PR 为纯文档同步操作,技术复杂度低,但具有重要的维护意义。建议所有文档贡献者阅读此 PR 的 commits 列表以了解如何确保文档一致性。值得关注的决策:被跳过的 PR 清单和原因(避免回退更新的内容)。