#38545 [Bugfix] Use dedicated MM processor cache in /tokenize to prevent sender-cache pollution
原始 PR · 作者 sergey-zinchenko · 合并时间 2026-04-02 12:14
修复 /tokenize 端点多模态缓存污染导致后续聊天请求失败的 bug。
建议精读此 PR,关注其如何通过隔离缓存解决多模态状态污染问题,以及参数传递方式的设计权衡(字典标志 vs. 显式参数)值得学习。适合前端服务和多模态开发工程师参考,以理解缓存管理和 API 端点交互。
参与讨论