← 返回仓库详情

#1749 Update MTP example configs, rename GLM-4.5 to GLM-4.7, clean scripts

THUDM/slime · 作者 zhuzilin · 合并时间 2026-03-22 16:24

分析状态已生成

文件变更 16提交数 1 · 评论 0

代码增减 +608 / -742

docs configuration shell

执行摘要

更新 MTP 示例配置，将 GLM-4.5 重命名为 GLM-4.7，并清理相关脚本。

PR body中明确说明目的是重命名GLM-4.5为GLM-4.7，替换文档中的所有引用，并同步已验证的配置（如Qwen3.5-27B的4节点32k GRPO配置）。这表明是为了维护文档和脚本与最新模型版本对齐，确保示例的时效性和正确性。

对于技术管理者，此PR无需精读代码，但建议关注文档变更的传播和用户通知。对于工程师，可参考更新的配置参数（如并行设置和投机解码）以优化自己的部署，但需注意脚本兼容性风险。

讨论亮点

review评论为空，表明本次变更未经过讨论或已直接合并，无争议点或设计权衡。

实现拆解

实现分为文档和脚本两大模块。文档方面：删除英文和中文的GLM-4.5-355B-A32B.md文件，新增GLM-4.7-355B-A32B.md文件，并更新索引（index.rst）和快速入门指南（quick_start.md）中的链接。脚本方面：重命名运行脚本（如run-glm4.5-355B-A32B.sh改为run-glm4.7-355B-A32B.sh），修改配置参数（如并行设置TP/PP/CP、投机解码步骤数），移除内部集群环境变量（如NCCL_IB_*），并删除冗余脚本run-qwen3.5-35B-A3B.sh。

文件	模块	状态	重要度
`docs/en/examples/glm4.7-355B-A32B.md`	docs	added	4.0
`scripts/run-glm4.7-355B-A32B.sh`	scripts	renamed	4.0
`scripts/run-qwen3.5-27B.sh`	scripts	modified	3.0

分析完成后，这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论，后续有更多讨论时会体现在这里。

风险与影响

风险包括：1. 文档重命名（如glm4.5-355B-A32B.md被删除）可能导致用户引用旧链接失效，需更新书签或文档引用。2. 脚本参数更改（如scripts/run-glm4.7-30B-A3B.sh中TP从4改为2、PP从1改为2）可能影响现有部署的兼容性，需验证新配置在不同环境下的稳定性。3. 移除内部环境变量可能简化脚本，但在特定集群配置中可能导致网络通信问题。4. 删除脚本run-qwen3.5-35B-A3B.sh可能影响依赖该脚本的用户，但已整合到27B示例中。

对用户影响：需要更新对GLM-4.5文档的引用，并使用新的GLM-4.7示例；配置参数优化可能提升训练效率。对系统影响：文档和脚本更准确，减少混淆；清理环境变量简化部署。对团队影响：维护更清晰的示例库，支持最新模型版本。

文档链接变更配置兼容性风险

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接，后续同步到相关引用后会出现在这里。

完整报告

执行摘要

本次PR主要更新了MTP示例配置，将GLM-4.5重命名为GLM-4.7，并清理了相关脚本和文档。这是一个常规维护性变更，旨在同步最新模型版本和优化示例配置，对用户影响较小但需注意文档引用更新。

功能与动机

为什么做：根据PR body描述，目的是重命名GLM-4.5为GLM-4.7，以反映模型升级；同时同步已验证的配置（如Qwen3.5-27B的4节点32k GRPO配置）并清理冗余脚本，提升示例的准确性和简洁性。

实现拆解

按模块拆解改动：

文档模块：删除旧版GLM-4.5文档（如docs/en/examples/glm4.5-355B-A32B.md），新增GLM-4.7文档（如docs/en/examples/glm4.7-355B-A32B.md），并更新索引和快速入门指南中的链接。
脚本模块：重命名运行脚本（如scripts/run-glm4.5-355B-A32B.sh改为run-glm4.7-355B-A32B.sh），修改配置参数，例如：
- 在scripts/run-glm4.7-30B-A3B.sh中，将TP从4改为2，PP从1改为2，并更新投机解码步骤数。
- 在scripts/run-deepseek-r1.sh中添加EAGLE MTP投机解码参数。
清理工作：移除内部集群环境变量（如NCCL_IB_*），删除冗余脚本scripts/run-qwen3.5-35B-A3B.sh。

评论区精华

讨论摘要：review评论为空，表明本次变更未经过讨论，直接合并执行。

风险与影响

具体风险：

文档风险：旧文档链接失效，用户需更新引用；新增文档可能未充分测试配置。
兼容性风险：脚本参数更改（如并行设置）可能在某些部署环境中引发问题，建议验证新配置。
简化风险：清理环境变量可能影响特定集群的网络配置。

影响评估：

用户：需要适应新文档和脚本，但配置优化可能提升训练效率。
系统：文档和脚本更清晰，减少维护负担。
团队：支持GLM-4.7模型，保持示例库的时效性。

关联脉络

与历史PR的关系：

近期PR如#1721（添加Qwen3.5-4B支持）和#1742（优化qwen3.5 loss mask）同样涉及模型配置更新，表明仓库正在持续维护和扩展模型示例库。
本PR是这一趋势的一部分，专注于GLM模型版本的更新和配置同步，未引入新功能但强化了文档和脚本的可用性。

支持 Prhub ♥

#1749 Update MTP example configs, rename GLM-4.5 to GLM-4.7, clean scripts

执行摘要

更新 MTP 示例配置，将 GLM-4.5 重命名为 GLM-4.7，并清理相关脚本。

实现拆解

评论区精华

没有提炼出高价值讨论线程

风险与影响

关联 Issue

未识别关联 Issue

完整报告

执行摘要

功能与动机

实现拆解

评论区精华

风险与影响

关联脉络

参与讨论