← 返回仓库列表

verl-project/verl

verl: Volcano Engine Reinforcement Learning for LLMs

监控状态：已开启最近同步：2026-04-18 18:11 同步状态：空闲下次计划：2026-04-18 19:11

PR 列表

已合并 143 · 已分析 143

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-03-16

#5610 [model] chore: Fix Qwen3-235B precision issues on NPU

作者 autbuster · 合并时间 2026-03-16 23:21

缺陷修复重要性 6.00 洞察度 5.00

修复 Qwen3-235B 模型在 NPU 上的精度问题，并提供训练脚本。

对于在 NPU 上部署大模型的工程师，此 PR 值得精读，关注 `vllm_async_server.py` 中 sleep_level 的处理方式，它揭示了 NPU 与 GPU 在引擎休眠行为上的差异；同时，训练脚本可作为配置模板，但需注意 review 中提到的语法陷阱。

查看完整分析 GitHub 原始 PR modelexamplesrollout

2026-03-13

#5578 [ci] chore: change machine for npu ci

作者 yyyy2000 · 合并时间 2026-03-13 18:26

基础设施重要性 4.00 洞察度 3.00

将 NPU CI 流水线机器从 A2-8 升级到 A2B3-8，并更新 Docker 镜像仓库。

该 PR 值得 CI 维护者或关注 NPU 测试环境的工程师精读，以了解环境升级的细节。对于大多数开发者，变更简单，可快速浏览文件列表确认影响范围。关注点包括机器类型升级的合理性（如性能提升）和镜像迁移的背景。

查看完整分析 GitHub 原始 PR cinpumisc

#5561 [megatron] feat: model engine support mtp

作者 ArronHZG · 合并时间 2026-03-13 14:56

功能重要性 6.00 洞察度 6.00

为 Megatron 模型引擎添加 MTP 支持，修复之前 break 并提升性能 23%。

建议技术管理者和工程师精读此 PR，重点关注 KV 缓存管理设计（在 `update_weights` 中整合 sleep/wake up 逻辑）和 MTP 前向传递的修改，以理解性能优化和内存管理权衡。同时，review 中提到的代码质量点值得后续改进。

查看完整分析 GitHub 原始 PR megatronmodelperf

#5381 [megatron, model] feat: qwen3.5 example

作者 ISEEKYAN · 合并时间 2026-03-13 10:47

功能重要性 7.00 洞察度 7.00

新增Qwen3.5模型的Megatron训练示例和代码支持。

此PR值得工程师精读，以了解如何适配新模型架构到现有训练框架。关注设计决策：chat_template的异常处理机制、tool_parser的扩展性、以及Megatron配置中use_remove_padding参数的设计权衡。对于维护者，建议审查Exception捕获逻辑，并跟踪Megatron-LM对Qwen3.5 THD格式的支持进展。

查看完整分析 GitHub 原始 PR modelmegatronexamples

2026-03-12

#5523 [ci] chore: update npu ci to vllm013

作者 yyyy2000 · 合并时间 2026-03-12 10:00

基础设施重要性 4.00 洞察度 3.00

升级NPU CI至vLLM 0.13.0，更新CANN版本为8.5.0并优化测试配置。

建议技术管理者快速浏览此PR以了解CI升级细节，工程师可关注Dockerfile重命名和测试配置变化，确保本地环境同步。PR包含有价值的CI维护经验，但无需深入代码逻辑。

查看完整分析 GitHub 原始 PR cinpudoc

2026-03-10

#5487 [fully_async, one_step_off] feat: support auto resume on abort when using fully_async

作者 ArronHZG · 合并时间 2026-03-10 19:00

功能重要性 7.00 洞察度 7.00

重构 fully_async 代理循环，支持中断时自动恢复，简化架构。

建议技术管理者和工程师精读此 PR，关注以下设计决策： - **架构简化**：移除专门的 partial agent loops，将中断恢复逻辑内聚到 `AsyncLLMServerManager`，值得学习如何减少冗余代码。 - **异常处理模式**：`task_exception_handler` 展示了异步任务异常日志的最佳实践，可借鉴到其他异步模块。 - **配置统一**：统一配置参数简化了用户接口，体现了设计一致性。同时，建议在合并后运行全面测试，验证中断恢复功能，并更新相关配置文件。

查看完整分析 GitHub 原始 PR rollouttrainermisc

2026-03-05

#5491 [doc] feat: add mtp spec log

作者 ArronHZG · 合并时间 2026-03-05 11:06

文档重要性 1.00 洞察度 1.00

在 MTP 文档中添加性能说明和图像，记录启用 MTP 对 rollout 接受率和 H20 GPU 吞吐量的影响。

对于工程师，此 PR 变更简单，无需深入阅读。但文档维护者应关注图像托管问题，考虑将图像内部化到项目仓库以避免未来 broken links。

查看完整分析 GitHub 原始 PR docrolloutmisc

第 18 / 18 页 · 共 143 条

上一页 1 … 14 15 16 17 18

支持 Prhub ♥