Prhub
← 返回仓库详情

标签聚合

vllm-project/vllm · 标签视图

标签列表

聚合结果

torch.compile 相关 PR

2026-04-10
性能优化 重要性 9.18 洞察度 7.00

引入LayerName不透明类型优化自定义操作符编译时间,避免字符串常量导致的重复编译。

compilation performance v1 torch.compile

建议精读 `vllm/utils/torch_utils.py` 中的 LayerName 实现,了解如何利用 PyTorch 不透明类型优化编译;同时关注编译融合模式中的条件逻辑设计,这对处理版本差异和性能调优有参考价值。

2026-04-09

#39286 [torch.compile] Allow usage of Opaque Objects in PyTorch 2.11

作者 zou3519 · 合并时间 2026-04-09 07:21

功能 重要性 6.00 洞察度 6.00

允许在 PyTorch 2.11 中使用 Opaque Objects,修复相关测试失败。

torch.compile v1 refactor

建议:对于使用 PyTorch 2.11 和 torch.compile 的开发者,此 PR 值得精读,以了解如何处理 Inductor 的 opaque objects 支持。关注 `_apply_constrain_to_fx_strides_patch` 的设计决策,以及版本检查的调整,这些反映了与上游 PyTorch 集成的技术权衡。

重构 重要性 5.00 洞察度 5.00

为split_module添加tuple_return参数,统一子图输出格式以稳定编译缓存键。

v1 refactor compilation torch.compile

该PR值得精读,特别是对于关注vLLM编译系统演进和PyTorch版本兼容性的工程师。虽然变更简单,但它揭示了编译缓存键稳定性的重要设计考量,以及如何通过统一输出格式来避免后续优化中的问题。建议关注split_graph函数的实现细节和版本条件逻辑。

2026-04-07
2026-04-01

#38592 [Kernel] [Helion] [17/N] Add Helion kernel torch.compile support

作者 gmagogsfm · 合并时间 2026-04-01 05:06

功能 重要性 6.00 洞察度 7.00

添加Helion kernel对torch.compile的支持,通过Dynamo变量追踪器实现无缝集成。

torch.compile feature test refactor

建议开发者和架构师精读此PR,特别是`vllm/kernels/helion/register.py`中的变量追踪器注册逻辑和初始化逻辑的调整。关注如何通过将初始化移到追踪区域外来解决Dynamo可追踪性问题,以及自定义HelionKernelWrapperVariable的设计决策,这对于理解PyTorch编译集成有参考价值。

重构 重要性 6.00 洞察度 6.00

重构Attention Quant Fusion Pass以减少样板代码,为未来fusion passes提供清晰基础。

refactor torch.compile quantization

建议工程师精读此PR,特别关注`VllmPatternReplacement`和`VllmFusionPatternMatcherPass`的设计决策,理解如何减少样板代码并处理缓存问题。对于从事编译优化或量化开发的团队成员,这是一个值得借鉴的重构案例。

2026-03-31

#38631 Fix MLA runs when use_inductor_graph_partition=True

作者 ElizaWszola · 合并时间 2026-03-31 21:37

缺陷修复 重要性 5.00 洞察度 3.00

修复 MLA 注意力在使用 inductor 图分区时输出乱码的问题。

bugfix torch.compile model

建议快速浏览此 PR,重点关注 unified_mla_kv_cache_update 函数的改动,以理解如何确保 torch.compile 正确捕获操作。对于处理 KV cache 或注意力机制的开发者有参考价值。

#37234 [Bugfix] Fix for builtins (forward fix of pytorch/177558)

作者 Lucaskabela · 合并时间 2026-03-31 09:08

缺陷修复 重要性 5.00 洞察度 6.00

修复PyTorch AOT编译中builtins序列化错误的猴子补丁。

bugfix torch.compile

建议工程师阅读此PR以学习条件性猴子补丁的实现和版本守卫策略,特别是_patched_get_runtime_env函数的设计;技术管理者应关注此修复,以规划未来torch版本迁移和移除猴子补丁的时间点。