Prhub

#25740 [AMD] Bump amd/Kimi-K2.5-MXFP4 revision to align with shared-experts fusion

原始 PR 作者 yctseng0211 合并时间 2026-05-19 13:47 文件变更 1 提交数 1 评论 3 代码增减 +7 / -1

执行摘要

修复 Kimi-K2.5 MXFP4 测试因模型版本过旧失败

PR #25390 为 AMD 路径启用了 Kimi-K2.5 的 shared-experts fusion,但测试使用的旧 revision(b071bc6f)中 shared experts 是 bf16 未量化,导致 weight 加载时报 RuntimeError: The size of tensor a (3584) must match the size of tensor b (7168)

建议合并。该修复是同行 PR #25390 的配套变更,确保 AMD 路径的 Kimi-K2.5 测试不会因模型版本过旧而失败。

讨论亮点

该 PR 无 review 评论,但作者在 PR body 中详细对比了新旧 revision 的 weight_scale 条目数,并附上 CI 通过截图。

实现拆解

  1. test/registered/amd/test_kimi_k25_mxfp4.py 中将 KIMI_K25_MXFP4_REVISION 从旧 commit SHA 更新为新的 HF main HEAD SHA,并添加多行注释说明升级原因及最低安全版本。
  2. 已验证新 revision 的 shared experts 包含 180 个 MXFP4 weight_scale 条目,确保 dtype/shape 与 fusion 路径匹配。
  3. 仅修改测试配置,无源码逻辑变更,属于最小风险修复。
文件 模块 状态 重要度
test/registered/amd/test_kimi_k25_mxfp4.py AMD 测试 modified 4.2

关键源码片段

test/registered/amd/test_kimi_k25_mxfp4.py test-coverage

唯一变更文件,更新了模型 revision 常量以兼容 shared-experts fusion。

# 测试文件 : test/registered/amd/test_kimi_k25_mxfp4.py
# 原 revision b071bc6f 的 shared_experts 为 bf16(未量化)
# 新 revision 419004c8 将 shared_experts 量化至 MXFP4(uint8)
# 从而兼容 shared-experts fusion 路径(PR #25390)
# 最低安全版本为 94d8c1bd(HF 2026-04-01 修复)
KIMI_K25_MXFP4_REVISION = (
    "419004c8716cf22c929aa15d39b85e09a8a2091a"
)

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

风险极低:仅修改测试中的模型版本号,不影响任何生产逻辑。但新 revision 可能引入模型行为的微小变化,已通过 CI 精度测试确认。

影响范围仅限于 AMD CI 中 Kimi-K2.5-MXFP4 测试,修复后该测试能正常通过 shared-experts fusion 路径。

依赖外部模型版本 低风险

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论