Prhub

#1749 Update MTP example configs, rename GLM-4.5 to GLM-4.7, clean scripts

THUDM/slime · 作者 zhuzilin · 合并时间 2026-03-22 16:24

分析状态 已生成
文件变更 16提交数 1 · 评论 0
代码增减 +608 / -742
docs configuration shell

执行摘要

更新 MTP 示例配置,将 GLM-4.5 重命名为 GLM-4.7,并清理相关脚本。

PR body中明确说明目的是重命名GLM-4.5为GLM-4.7,替换文档中的所有引用,并同步已验证的配置(如Qwen3.5-27B的4节点32k GRPO配置)。这表明是为了维护文档和脚本与最新模型版本对齐,确保示例的时效性和正确性。

对于技术管理者,此PR无需精读代码,但建议关注文档变更的传播和用户通知。对于工程师,可参考更新的配置参数(如并行设置和投机解码)以优化自己的部署,但需注意脚本兼容性风险。

讨论亮点

review评论为空,表明本次变更未经过讨论或已直接合并,无争议点或设计权衡。

实现拆解

实现分为文档和脚本两大模块。文档方面:删除英文和中文的GLM-4.5-355B-A32B.md文件,新增GLM-4.7-355B-A32B.md文件,并更新索引(index.rst)和快速入门指南(quick_start.md)中的链接。脚本方面:重命名运行脚本(如run-glm4.5-355B-A32B.sh改为run-glm4.7-355B-A32B.sh),修改配置参数(如并行设置TP/PP/CP、投机解码步骤数),移除内部集群环境变量(如NCCL_IB_*),并删除冗余脚本run-qwen3.5-35B-A3B.sh。

文件 模块 状态 重要度
docs/en/examples/glm4.7-355B-A32B.md docs added 4.0
scripts/run-glm4.7-355B-A32B.sh scripts renamed 4.0
scripts/run-qwen3.5-27B.sh scripts modified 3.0

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

风险包括:1. 文档重命名(如glm4.5-355B-A32B.md被删除)可能导致用户引用旧链接失效,需更新书签或文档引用。2. 脚本参数更改(如scripts/run-glm4.7-30B-A3B.sh中TP从4改为2、PP从1改为2)可能影响现有部署的兼容性,需验证新配置在不同环境下的稳定性。3. 移除内部环境变量可能简化脚本,但在特定集群配置中可能导致网络通信问题。4. 删除脚本run-qwen3.5-35B-A3B.sh可能影响依赖该脚本的用户,但已整合到27B示例中。

对用户影响:需要更新对GLM-4.5文档的引用,并使用新的GLM-4.7示例;配置参数优化可能提升训练效率。对系统影响:文档和脚本更准确,减少混淆;清理环境变量简化部署。对团队影响:维护更清晰的示例库,支持最新模型版本。

文档链接变更 配置兼容性风险

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

执行摘要

本次PR主要更新了MTP示例配置,将GLM-4.5重命名为GLM-4.7,并清理了相关脚本和文档。这是一个常规维护性变更,旨在同步最新模型版本和优化示例配置,对用户影响较小但需注意文档引用更新。

功能与动机

为什么做:根据PR body描述,目的是重命名GLM-4.5为GLM-4.7,以反映模型升级;同时同步已验证的配置(如Qwen3.5-27B的4节点32k GRPO配置)并清理冗余脚本,提升示例的准确性和简洁性。

实现拆解

按模块拆解改动

  • 文档模块:删除旧版GLM-4.5文档(如docs/en/examples/glm4.5-355B-A32B.md),新增GLM-4.7文档(如docs/en/examples/glm4.7-355B-A32B.md),并更新索引和快速入门指南中的链接。
  • 脚本模块:重命名运行脚本(如scripts/run-glm4.5-355B-A32B.sh改为run-glm4.7-355B-A32B.sh),修改配置参数,例如:
    • scripts/run-glm4.7-30B-A3B.sh中,将TP从4改为2,PP从1改为2,并更新投机解码步骤数。
    • scripts/run-deepseek-r1.sh中添加EAGLE MTP投机解码参数。
  • 清理工作:移除内部集群环境变量(如NCCL_IB_*),删除冗余脚本scripts/run-qwen3.5-35B-A3B.sh

评论区精华

讨论摘要:review评论为空,表明本次变更未经过讨论,直接合并执行。

风险与影响

具体风险

  • 文档风险:旧文档链接失效,用户需更新引用;新增文档可能未充分测试配置。
  • 兼容性风险:脚本参数更改(如并行设置)可能在某些部署环境中引发问题,建议验证新配置。
  • 简化风险:清理环境变量可能影响特定集群的网络配置。

影响评估

  • 用户:需要适应新文档和脚本,但配置优化可能提升训练效率。
  • 系统:文档和脚本更清晰,减少维护负担。
  • 团队:支持GLM-4.7模型,保持示例库的时效性。

关联脉络

与历史PR的关系

  • 近期PR如#1721(添加Qwen3.5-4B支持)和#1742(优化qwen3.5 loss mask)同样涉及模型配置更新,表明仓库正在持续维护和扩展模型示例库。
  • 本PR是这一趋势的一部分,专注于GLM模型版本的更新和配置同步,未引入新功能但强化了文档和脚本的可用性。

参与讨论