执行摘要
在 ImageEmbeddingMediaIO 中添加 numpy 数组支持,减少 payload 大小并提升序列化性能。
PR body指出,当前Image Embeddings类依赖torch.save和torch.load,这会导致payload大小增加3倍(由于Pickle)。benchmark显示使用numpy能显著减少开销并提升性能,例如codes+grid的编解码延迟降低4.1倍。讨论中引用了Slack线程以支持此改进。
建议精读此PR,特别是安全修复部分和性能优化设计;关注_load_numpy方法的实现和测试用例,以学习如何处理不同数据格式。
review中,gemini-code-assist[bot]指出在load_file方法中意外移除了torch.sparse.check_sparse_tensor_invariants()上下文管理器,这可能引入安全漏洞;作者随后通过提交恢复。另建议将numpy导入移至文件顶部以优化性能,已采纳。DarkLight1337提出代码风格nits,如移除不必要注释,以减少diff。
参与讨论