执行摘要
修复 Grok-1 模型加载因缺失 rope_theta 属性的崩溃,影响 AMD INT4 版本。
AMD nightly CI jobs nightly-8-gpu-grok1-int4 和 nightly-8-gpu-mi35x-grok1-int4 在加载Grok-1模型时崩溃,错误为 AttributeError: 'Grok1Config' object has no attribute 'rope_theta'。这是由#21135引入的,该PR将 grok.py 从安全的 getattr(config, "rope_theta", 10000) 迁移到共享的 get_rope_config(config) helper。Grok-1 INT4模型使用自定义 Grok1Config 类,未定义 rope_theta 属性。
该PR值得快速浏览以理解如何处理HuggingFace配置中缺失属性的兼容性问题,但变更简单,无需深入分析。关注本地提取逻辑作为处理配置版本差异的示例。
Review讨论较少,reviewer yctseng0211直接批准。在Issue评论中,作者michaelzhang-ai强调了变更范围有限:"no NVIDIA / common code impact",并确认了Grok-1 FP8和Grok-2不受影响。yctseng0211更新分支以包含PR 21547解决stage-a failure。没有争议或未解决疑虑。
参与讨论