Prhub
← 返回仓库列表

verl-project/verl

verl: Volcano Engine Reinforcement Learning for LLMs

监控状态:已开启 最近同步:2026-04-18 18:11 同步状态:空闲 下次计划:2026-04-18 19:11

PR 列表

已合并 143 · 已分析 143
更多筛选
2026-03-16
缺陷修复 重要性 6.00 洞察度 5.00

修复 Qwen3-235B 模型在 NPU 上的精度问题,并提供训练脚本。

对于在 NPU 上部署大模型的工程师,此 PR 值得精读,关注 `vllm_async_server.py` 中 sleep_level 的处理方式,它揭示了 NPU 与 GPU 在引擎休眠行为上的差异;同时,训练脚本可作为配置模板,但需注意 review 中提到的语法陷阱。

2026-03-13

#5578 [ci] chore: change machine for npu ci

作者 yyyy2000 · 合并时间 2026-03-13 18:26

基础设施 重要性 4.00 洞察度 3.00

将 NPU CI 流水线机器从 A2-8 升级到 A2B3-8,并更新 Docker 镜像仓库。

该 PR 值得 CI 维护者或关注 NPU 测试环境的工程师精读,以了解环境升级的细节。对于大多数开发者,变更简单,可快速浏览文件列表确认影响范围。关注点包括机器类型升级的合理性(如性能提升)和镜像迁移的背景。

#5561 [megatron] feat: model engine support mtp

作者 ArronHZG · 合并时间 2026-03-13 14:56

功能 重要性 6.00 洞察度 6.00

为 Megatron 模型引擎添加 MTP 支持,修复之前 break 并提升性能 23%。

建议技术管理者和工程师精读此 PR,重点关注 KV 缓存管理设计(在 `update_weights` 中整合 sleep/wake up 逻辑)和 MTP 前向传递的修改,以理解性能优化和内存管理权衡。同时,review 中提到的代码质量点值得后续改进。

#5381 [megatron, model] feat: qwen3.5 example

作者 ISEEKYAN · 合并时间 2026-03-13 10:47

功能 重要性 7.00 洞察度 7.00

新增Qwen3.5模型的Megatron训练示例和代码支持。

此PR值得工程师精读,以了解如何适配新模型架构到现有训练框架。关注设计决策:chat_template的异常处理机制、tool_parser的扩展性、以及Megatron配置中use_remove_padding参数的设计权衡。对于维护者,建议审查Exception捕获逻辑,并跟踪Megatron-LM对Qwen3.5 THD格式的支持进展。

2026-03-12

#5523 [ci] chore: update npu ci to vllm013

作者 yyyy2000 · 合并时间 2026-03-12 10:00

基础设施 重要性 4.00 洞察度 3.00

升级NPU CI至vLLM 0.13.0,更新CANN版本为8.5.0并优化测试配置。

建议技术管理者快速浏览此PR以了解CI升级细节,工程师可关注Dockerfile重命名和测试配置变化,确保本地环境同步。PR包含有价值的CI维护经验,但无需深入代码逻辑。

2026-03-10
功能 重要性 7.00 洞察度 7.00

重构 fully_async 代理循环,支持中断时自动恢复,简化架构。

建议技术管理者和工程师精读此 PR,关注以下设计决策: - **架构简化**:移除专门的 partial agent loops,将中断恢复逻辑内聚到 `AsyncLLMServerManager`,值得学习如何减少冗余代码。 - **异常处理模式**:`task_exception_handler` 展示了异步任务异常日志的最佳实践,可借鉴到其他异步模块。 - **配置统一**:统一配置参数简化了用户接口,体现了设计一致性。 同时,建议在合并后运行全面测试,验证中断恢复功能,并更新相关配置文件。

2026-03-05

#5491 [doc] feat: add mtp spec log

作者 ArronHZG · 合并时间 2026-03-05 11:06

文档 重要性 1.00 洞察度 1.00

在 MTP 文档中添加性能说明和图像,记录启用 MTP 对 rollout 接受率和 H20 GPU 吞吐量的影响。

对于工程师,此 PR 变更简单,无需深入阅读。但文档维护者应关注图像托管问题,考虑将图像内部化到项目仓库以避免未来 broken links。

参与讨论