Repositories / vllm-project / vllm

vllm-project/vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

监控状态：已开启最近同步：2026-06-01 12:31 同步状态：空闲下次计划：2026-06-01 13:31

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-03-31

#33176 [EPLB] Add alternative communication for EPLB weight exchange

原始 PR · 作者 ilmarkov · 合并时间 2026-03-31 20:17

功能重要性 6.00 洞察度 7.00

新增EPLB权重交换通信器抽象，支持多后端以避免异步挂起。

该PR值得精读，尤其对于从事分布式通信或EPLB开发的工程师。值得关注的设计决策包括：通信器抽象模式（工厂方法create_eplb_communicator）、多后端权衡（如Gloo避免NCCL冲突但牺牲性能）、以及无状态通信需求的处理（pynccl后端）。建议结合review讨论，理解为何pynccl被保留，以及异步流管理的最佳实践。

featurerefactortest

#36742 [EPD] update EPD script arguments

原始 PR · 作者 zhenwei-intel · 合并时间 2026-03-31 20:02

功能重要性 5.00 洞察度 4.00

更新EPD示例脚本以支持平台感知和参数化服务参数。

对于涉及多平台部署或EPD功能的工程师，建议精读此PR以了解平台抽象的设计（如DEVICE_PLATFORM切换逻辑）和参数化配置的实现。关注JSON格式修复的细节，以确保类似脚本变更的正确性。

documentationkv-connectorxpu

#38612 [CI Failure] pin colmodernvbert revision

原始 PR · 作者 noooop · 合并时间 2026-03-31 18:54

缺陷修复重要性 4.00 洞察度 3.00

通过 pin 定 colmodernvbert 模型 revision 修复 CI 失败，确保多模态测试稳定。

该 PR 是标准 CI 修复，变更简单直接，适合快速浏览以了解如何处理外部依赖版本控制。无需深入精读，但可关注其代码风格改进（常量命名大写）和注释实践（FIXME 注释）。

bugfixtestmulti-modality

#31113 Fix document of torchrun_example.py

原始 PR · 作者 foreverlms · 合并时间 2026-03-31 18:54

文档重要性 2.00 洞察度 2.00

修复torchrun_example.py文档中进程数匹配并行维度的说明。

对于大多数工程师，该PR不值得精读，除非您直接使用或维护torchrun_example.py相关代码。关注点在于文档更新的正确性和review中讨论的潜在不完整性问题，可作为文档维护的参考案例。

documentationcleanup

#38584 [CI][Bugfix] Fix `test_run_eagle_dp`

原始 PR · 作者 MatthewBonanni · 合并时间 2026-03-31 18:30

缺陷修复重要性 5.00 洞察度 4.00

修复Eagle DP测试不稳定性，通过在批量不变性启用时禁用AOT调度。

建议快速浏览此PR，关注AOT调度与批次不变性的设计权衡，以及测试调整如何缓解flaky问题；但可跳过详细代码分析，因变更较小。

bugfixtestci

#38129 DOC: TPU mention fix

原始 PR · 作者 mtsokol · 合并时间 2026-03-31 18:27

文档重要性 1.00 洞察度 1.00

修复vllm/config/parallel.py中TPU支持的文档描述，更新链接以提升准确性。

此PR不值得精读代码逻辑，但review讨论中关于文档准确性和TPU支持的设计决策值得关注，尤其是gemini-code-assist[bot]提出的不准确性，可作为文档维护的参考。

documentationbugfix

#38570 [Misc] Move --grpc CLI argument into make_arg_parser

原始 PR · 作者 CatherineSue · 合并时间 2026-03-31 18:24

重构重要性 3.00 洞察度 4.00

将--grpc CLI参数从serve.py移至cli_args.py以统一前端参数定义。

建议快速浏览此PR以了解参数管理的调整，但特别关注gemini-code-assist[bot]的设计争议。对于技术管理者，此PR展示了代码重构中模块边界的重要性，值得考虑未来是否进一步重构参数定义到更通用的模块。

refactorfrontendcleanup

#38613 [Feature]: add presence_penalty and frequency_penalty fields to Responses API

原始 PR · 作者 chaunceyjiang · 合并时间 2026-03-31 16:45

功能重要性 5.00 洞察度 4.00

为Responses API添加presence_penalty和frequency_penalty字段，增强OpenAI兼容性。

此PR值得精读，特别是学习如何将外部API规范集成到现有系统，并处理验证约束以提供更好的错误反馈。关注Pydantic模型验证和参数默认值处理的设计决策。

frontendfeatureresponses-api

第 217 / 253 页 · 共 2022 条

上一页 1 … 215 216 217 218 219 … 253 下一页