Prhub

vllm-project/vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

监控状态:已开启 最近同步:2026-06-04 09:45 同步状态:空闲 下次计划:2026-06-04 10:45

PR 列表

更多筛选
2026-05-28
功能 重要性 5.98 洞察度 4.00

为 EC Connector 添加 shutdown 关闭接口

该 PR 改动量小,设计清晰,值得快速审核合并。对于 EC connector 实现者,建议阅读 ECConnectorBase.shutdown 和 ensure_ec_transfer_shutdown 的使用方式,并在子类中覆盖 shutdown 以处理异步操作排空。

#41406 Log dummy DP step in iteration details

原始 PR · 作者 vadiklyutiy · 合并时间 2026-05-28 20:18

缺陷修复 重要性 6.68 洞察度 4.00

修复DP模式迭代索引不同步,增加dummy步日志

值得快速合并的小而精的修复。设计上对核心路径(`step()`)改动极少,将逻辑隔离在日志上下文管理器中,保持了代码整洁。建议后续考虑异常保护,确保索引递增在异常时也能执行。

功能 重要性 6.81 洞察度 5.00

为 Anthropic API 添加结构化输出和 effort 参数支持

该 PR 可以精读以了解如何扩展 Anthropic API 入口,特别关注 `_handle_output_config` 的转换模式。设计决策方面,注意 `effort` 被放在 `output_config` 内而非顶层,与官方规范略有偏离,但保持了内部一致性。测试用例提供了良好的参考。

#43866 [CI] Auto-apply `rust` label to relevant PRs

原始 PR · 作者 BugenZhao · 合并时间 2026-05-28 19:57

基础设施 重要性 3.53 洞察度 2.00

自动为 Rust 相关 PR 添加标签

这是一个简单的基础设施改进,值得合并。对于 CI 维护者,可后续监控标签准确率,必要时调整匹配条件。

缺陷修复 重要性 5.91 洞察度 5.00

修复 ROCm gfx950 上稀疏索引器精度问题

此 PR 值得关注,特别是 ROCm 开发和模型精度维护团队。代码改动简洁,但涉及 ROCm 稀疏索引器的核心逻辑,建议确保所有相关 kernel 配置匹配,并补充自动化测试。

参与讨论