# PR #22712 完整报告

- 仓库：`sgl-project/sglang`
- 标题：[NPU] update glm5 running guide
- 合并时间：2026-04-13 22:53
- 原文链接：http://prhub.com.cn/sgl-project/sglang/pull/22712

---

## 执行摘要
本次 PR 更新了昇腾 NPU 平台的文档，为 GLM5 模型添加了最佳实践指南，主要明确了 transformers 依赖应安装版本 5.3.0，并提供了 PyPI 和 GitHub 两种安装方式。这是一个纯粹的文档维护性变更，风险极低，旨在提升用户在特定硬件平台上部署模型的体验。

## 功能与动机
根据 PR 描述，本次变更的目的是“更新 NPU 文档，添加 GLM5 在昇腾 NPU 上支持的最佳实践”。这反映出项目需要为特定硬件（NPU）和特定模型（GLM5）的使用提供更清晰、更具体的操作指导，特别是依赖版本管理方面，以避免用户因使用错误版本而遇到问题。

## 实现拆解
1. **变更入口**：修改了 `docs/platforms/ascend/ascend_npu_glm5_examples.md` 文件，这是专门记录昇腾 NPU 平台示例的文档。
2. **核心内容更新**：在文档中新增了“最佳实践”章节，并重写了 transformers 库的安装说明。
 - **变更前**：仅简单建议“更新 transformers 到 main 分支”。
 - **变更后**：明确要求安装 **版本 5.3.0**，并提供了两种具体的安装命令：
 - 通过 PyPI 安装：`pip install transformers==5.3.0`
 - 通过 GitHub 特定标签安装：`pip install git+https://github.com/huggingface/transformers.git@v5.3.0`
3. **配套改动**：无。本次 PR 仅涉及文档更新，没有代码、测试、配置或部署脚本的修改。

## 评论区精华
本次 PR 没有产生实质性的技术讨论。唯一的 review 是由 `sglang-npu-bot` 自动完成的批准，没有留下任何评论。这表明变更内容直接、无争议，属于常规的文档维护工作，团队对此类更新流程已自动化。

## 风险与影响
- **技术风险**：几乎为零。仅修改文档，不触及任何运行时代码、配置或系统逻辑，因此不存在回归、性能、安全或兼容性风险。
- **影响分析**：
 - **正面影响**：为在昇腾 NPU 上运行 GLM5 模型的用户提供了准确、可操作的依赖安装指南，减少了因版本问题导致的部署失败，提升了用户体验和文档的实用性。
 - **影响范围**：仅限于阅读并使用该特定文档的用户群体，对系统整体无影响。

## 关联脉络
从近期历史 PR 分析来看，本项目对 NPU 平台的支持是一个持续进行的专项工作（标签 `npu`）。虽然本次 PR（#22712）是一个独立的文档更新，但它与 NPU 生态的维护一脉相承。近期其他 PR 如 #22363（修复 AMD ROCm Docker 镜像问题）和 #22773（优化 MoE 层性能）展示了项目在多硬件平台（AMD、NPU）和性能优化方面的持续投入。本次文档更新可以视为确保 NPU 平台用户体验与功能开发保持同步的一部分。