← 返回仓库详情

标签聚合

verl-project/verl · 标签视图

标签列表

misc · 79

trainer · 64

rollout · 35

megatron · 32

npu · 31

ci · 27

model · 24

perf · 17

vllm · 16

doc · 14

examples · 14

fsdp · 12

config · 11

worker · 10

docker · 9

distillation · 7

experimental · 7

fully_async · 7

lora · 6

algo · 5

deps · 5

quantization · 5

sglang · 5

tool · 5

ckpt · 4

diffusion · 4

reward · 4

agent_loop · 3

trtllm · 3

veomni · 3

data · 2

teacher · 2

one_step_off · 1

transferqueue · 1

聚合结果

vllm 相关 PR

2026-04-14

#5961 [rollout, vllm] fix: auto-convert disable_mm_preprocessor_cache to mm_processor_cache_gb for vllm >= 0.13.0

作者 Silas-11 · 合并时间 2026-04-14 14:26

缺陷修复重要性 6.00 洞察度 5.00

自动转换 vLLM 废弃的多模态预处理器缓存参数，确保 vLLM >= 0.13.0 的兼容性。

rollout vllm examples misc

建议工程团队精读此 PR，特别是 `vllm_async_server.py` 中的版本适配逻辑，作为处理第三方库 API 变化的参考案例。关注参数转换的策略和冲突处理方式，以应用于类似兼容性修复场景。

查看完整分析 GitHub 原始 PR

#5809 [ci, vllm] chore: update vllm-omni 0.18.0 official release and Miscellaneous

作者 AndyZhou952 · 合并时间 2026-04-14 14:05

其他重要性 6.00 洞察度 5.00

升级vllm-omni至0.18.0官方版本，新增TP支持并同步上游代码模式。

ci vllm agent_loop diffusion

建议开发者精读此PR以了解vllm-omni 0.18.0的集成方式，特别是TP支持的测试策略和代码简化模式。关注_create_tp_compatible_model函数的设计，适用于处理模型配置不兼容的测试场景，以及如何通过上下文管理器优雅管理临时资源。

查看完整分析 GitHub 原始 PR

2026-04-10

#5596 [docker] feat: Add GB200 (aarch64/Blackwell) Docker image and training example

作者 kaixih · 合并时间 2026-04-10 11:23

功能重要性 6.00 洞察度 6.00

为GB200（aarch64/Blackwell）添加Docker镜像和训练示例，扩展硬件支持并适配测试。

docker trainer examples rollout vllm

建议技术管理者和工程师精读此PR，重点关注Dockerfile多架构设计决策（如统一x86_64/aarch64支持）、测试动态适配策略（使用`torch.cuda.device_count()`）以及硬件特定配置（如Blackwell的FlashAttention限制）。讨论中的设计权衡，如Dockerfile合并过程和依赖版本管理，也值得借鉴。

查看完整分析 GitHub 原始 PR

2026-04-09

#5934 [vllm] fix: remove redudant clone in weight refit

作者 wuxibin89 · 合并时间 2026-04-09 19:49

缺陷修复重要性 5.00 洞察度 6.00

修复vLLM权重重配中的冗余克隆和竞态条件，并启用编码器缓存重置。

vllm rollout perf npu

建议精读`bucketed_weight_transfer.py`的变更，重点关注竞态条件修复的实现逻辑。对于涉及vLLM权重传输或colocate模式开发的工程师，此PR展示了缓冲区同步和版本条件处理的设计决策，值得学习。

查看完整分析 GitHub 原始 PR

#5759 [ci] chore: add vllm_ascend.yaml

作者 Annarine · 合并时间 2026-04-09 15:13

基础设施重要性 6.00 洞察度 5.00

新增针对 Ascend NPU 的 vLLM CI 测试工作流，提升 vLLM 在 NPU 环境的验证能力。

ci npu vllm

建议关注以下两点： 1. **对于 CI/基础设施开发者**：此 PR 新增的 `vllm_ascend.yml` 工作流设计值得精读，特别是其路径排除策略和 NPU 专用资源配置，可作为在 VERL 中新增硬件特定 CI 的参考模板。 2. **对于核心开发者**：`agent_utils.py` 的修改虽小，但引发的 `gemini-code-assist[bot]` 关于设备配置化的讨论具有普遍意义——在测试工具函数中，硬编码设备检测可能限制测试场景。虽未在本 PR 中实施，但未来类似改动可考虑采纳该建议以提升灵活性。

查看完整分析 GitHub 原始 PR

2026-04-02

#5866 [vllm] fix: Fix vLLM synchronization error caused by SGLang skipping resume optimize

作者 ZLiao097 · 合并时间 2026-04-02 20:23

缺陷修复重要性 5.00 洞察度 4.00

修复vLLM因SGLang优化跳过权重恢复导致的同步错误

vllm rollout worker

该PR值得精读，尤其关注SGLang与vLLM在权重恢复机制上的差异，以及如何通过简化条件逻辑解决跨引擎兼容性问题。建议结合PR #5769理解上下文。

查看完整分析 GitHub 原始 PR

2026-03-27

#5756 [hardware, rollout] feat: enable MXFP8 rollout on Ascend 950 devices (DV100 & DV120)

作者 zhijie-os · 合并时间 2026-03-27 10:07

功能重要性 6.00 洞察度 5.00

在 Ascend 950 设备上启用 MXFP8 量化 rollout 支持。

rollout vllm quantization

建议关注硬件特定的量化实现细节，如 `restore_mxfp8_weights_for_loading` 和 `apply_mxfp8_transformation_after_loading` 函数的逻辑，这些设计有助于处理权重加载后的转换。对于使用 Ascend 设备的开发者，此 PR 值得精读以了解 MXFP8 量化集成的完整流程。同时，留意 review 中解决的兼容性问题，可作为类似硬件适配的参考。

查看完整分析 GitHub 原始 PR

2026-03-26

#5695 [fully_async] fix: Patch vllm013 weight loader for qwen3-moe series

作者 wangshuyang31 · 合并时间 2026-03-26 20:33

缺陷修复重要性 6.00 洞察度 5.00

修复 vllm 0.13 中 qwen3-moe 模型的权重加载问题。

vllm model misc

建议工程团队仔细审查此 PR，特别是权重转置的逻辑设计和版本检查的实现。对于负责 vllm 集成的开发者，这是一个有价值的修复案例，可以借鉴其错误处理和代码优化策略。

查看完整分析 GitHub 原始 PR

第 1 / 2 页 · 共 16 条

1 2 下一页