Prhub

vllm-project/vllm · 标签视图

标签列表

聚合结果

configuration 相关 PR

2026-05-19
性能优化 重要性 7.63 洞察度 5.00

重新启用 FlashInfer 自动调优并广播策略至所有 rank

若关注 FlashInfer kernel 性能优化或 vLLM 配置系统,建议仔细阅读该 PR。其广播策略设计值得参考,临时文件处理方面也有改进空间。

2026-05-18
缺陷修复 重要性 5.51 洞察度 5.00

KV Connector 存在时默认回退 MRv1

建议精读此 PR 的处理思路:临时降级而非禁用 MRv2,体现了兼容性折中。同时建议关注后续对 `is_kv_transfer_instance` 属性的接入,以精细化降级条件。