#22184 Cache sub-objects in __getitem__ to ensure identity stability
原始 PR · 作者 merrymercy · 合并时间 2026-04-07 09:53
在 GenerateReqInput 和 EmbeddingReqInput 的 __getitem__ 方法中添加缓存,确保重复调用返回同一对象实例,防止同步问题。
建议精读 python/sglang/srt/managers/io_struct.py 的缓存实现,关注设计决策如何平衡对象创建开销与内存使用,以及 tokenizer_manager.py 中的属性传播机制。对于涉及请求处理、批处理或对象管理的开发人员,此 PR 提供了重要的对象身份稳定性范例,值得学习以避免类似同步问题。
参与讨论