Prhub
← 返回仓库列表

PaddlePaddle/FastDeploy

High-performance Inference and Deployment Toolkit for LLMs and VLMs based on PaddlePaddle

监控状态:已开启 最近同步:2026-04-18 21:29 同步状态:空闲 下次计划:2026-04-18 22:29

PR 列表

已合并 179 · 已分析 179
更多筛选
2026-04-11

#7337 [RL]moe bf16 ep support paddle batch_gemm

作者 ckl117 · 合并时间 2026-04-11 21:51

功能 重要性 6.00 洞察度 5.00

为MoE BF16 EP prefill阶段添加Paddle batched_gemm支持,对齐训练实现。

建议技术管理者和工程师精读此PR,重点关注: 1. **设计决策**:为何选择batched_gemm而非原有compute_ffn,以及如何权衡CUDAGraph兼容性。 2. **风险点**:down_proj_bias处理缺失和外部依赖函数可用性,需确认是否在后续提交中修复。 3. **测试补充**:建议添加FD_MOE_PROB_IN_ADVANCE相关的单元测试,确保新路径正确性。 PR展示了推理与训练对齐的典型模式,值得学习其实现思路。

基础设施 重要性 4.00 洞察度 3.00

修复CI nightly测试错误,移除特权模式并添加容器清理逻辑。

该PR值得CI维护者精读,重点关注--privileged移除对RDMA编译的影响,建议在合并后观察相关构建作业。设计决策体现了安全与功能的权衡,但缺乏对review反馈的回应,可能暗示团队对AI review的采纳策略。

#7320 [XPU][CI] fix xpu ci bug

作者 plusNew001 · 合并时间 2026-04-11 00:26

基础设施 重要性 3.00 洞察度 3.00

修复XPU CI依赖版本问题,将XTDK从latest固定为3.6.2.1。

该PR变更简单直接,适合快速了解CI版本管理最佳实践。值得关注的点是:在CI脚本中避免使用'latest'等不确定版本是基础设施维护的常见模式。

2026-04-10
基础设施 重要性 4.00 洞察度 5.00

为 CI workflow 添加容器清理步骤并移除不必要特权,防止资源泄漏。

建议 CI 维护者和基础设施工程师精读此 PR,重点关注清理步骤的实现细节(如 `if: always()` 条件的使用)和安全改进(移除 `--privileged`)。设计决策如移除 `--rm` 参数与显式清理的权衡,以及依赖预构建 wheel 的优化策略,值得学习以应用于其他 CI 优化场景。

缺陷修复 重要性 4.00 洞察度 3.00

修复overlap调度模式下MTP空输入未执行问题,确保EP模型行为一致。

该PR值得快速浏览,以了解overlap schedule模式下MTP空输入处理的修复逻辑。重点关注条件判断的完整性和与execute_model_normal的一致性。由于缺少测试覆盖,建议后续补充相关单元测试。

#7269 [RL] change rms norm for glm

作者 zhangbo9674 · 合并时间 2026-04-10 16:02

功能 重要性 6.00 洞察度 7.00

为GLM4 MoE模型添加环境变量控制的Paddle phi RMSNorm支持,替换默认归一化实现。

建议技术管理者仔细阅读此PR,重点关注rms_norm_func的实现细节和讨论中的正确性问题;工程师可学习环境变量控制机制和proxy模式的设计权衡;由于缺少测试,合并后应补充单元测试和精度验证以确保稳定性。

参与讨论