#39344 fix(kimi_k25): resolve media_placeholder_token_id from tokenizer
作者 r266-tech · 合并时间 2026-04-12 12:10
修复 Kimi-K2.5 多模态推理因媒体占位符 token ID 不匹配导致的崩溃问题。
该 PR 值得精读,因为它展示了处理模型配置与运行时 tokenizer 不一致的优雅模式:通过 tokenizer 解析关键 token ID 并动态打补丁配置,同时添加防护检查避免静默失败。关注设计决策:在初始化时解析并缓存 token ID,避免每次调用都查询 tokenizer;使用 logger.warning_once 记录不一致情况,便于调试;添加 unk_token_id 验证确保鲁棒性。
参与讨论