Prhub
← 返回仓库列表

PaddlePaddle/FastDeploy

High-performance Inference and Deployment Toolkit for LLMs and VLMs based on PaddlePaddle

监控状态:已开启 最近同步:2026-04-18 22:32 同步状态:空闲 下次计划:2026-04-18 23:32

PR 列表

已合并 179 · 已分析 179
更多筛选
2026-04-03
功能 重要性 5.00 洞察度 4.00

在调度器V1中支持通过环境变量禁用分块预填充功能。

该PR值得关注,因为它触及了调度器资源分配的核心逻辑。建议精读以理解分块预填充的禁用机制如何集成到现有流程中,并思考其设计意图。重点关注:1. 环境变量驱动的特性开关设计模式;2. 条件检查在分配循环中的位置及其对控制流的影响;3. 与现有分块逻辑的交互。同时,建议补充测试以确保新分支的健壮性。

2026-04-02

#7154 [BugFix]fix extract_tool_calls

作者 luukunn · 合并时间 2026-04-02 21:18

缺陷修复 重要性 4.00 洞察度 3.00

修复 ErnieX1 工具调用解析器在无标记时错误返回 tools_called=True 的语义 bug。

该 PR 值得快速浏览以理解工具解析器的错误处理逻辑,但变更直白,无需深入剖析。关注点在于前置检查的设计和测试更新的一致性。

#7039 [Optimization] merge_allreduce

作者 fxyfxy777 · 合并时间 2026-04-02 19:52

optimization 重要性 6.00 洞察度 5.00

优化GLM4-MoE模型在纯TP并行模式下的AllReduce通信,合并两个FFN分支的归约操作。

该PR值得精读,特别是对于关注分布式优化和MoE模型性能的工程师。核心设计决策在于如何根据并行模式动态调整归约策略,这种条件化通信优化模式值得借鉴。建议重点关注merge_ffn_tp的判断逻辑和reduce_results的参数传递一致性。

#7101 [Others]Upgrade PaddleFormers to version 1.1.1

作者 bukejiyu · 合并时间 2026-04-02 16:07

基础设施 重要性 3.00 洞察度 2.00

升级PaddleFormers依赖版本至1.1.1,放宽版本约束为>=1.1.1。

该PR变更简单,不值得深入精读代码实现。但建议: 1. 关注后续是否有相关测试PR验证升级后的兼容性。 2. 了解PaddleFormers 1.1.1的具体变更内容,评估对FastDeploy的影响。 3. 监控CI/CD测试结果,确保升级未引入回归问题。

功能 重要性 3.00 洞察度 4.00

为OpenAI协议请求添加临时参数video_fps,支持视频理解基准测试。

该PR实现简单,可快速浏览了解协议扩展模式。值得关注的是Copilot指出的设计问题:临时参数如何与现有处理链路集成。建议结合后续是否补充消费逻辑的PR一起分析。

基础设施 重要性 3.00 洞察度 3.00

将CI Docker配置从ipc=host改为shm-size和sysctl,提升测试隔离性和稳定性。

该PR变更直接,适合快速浏览以了解CI配置优化。值得关注的设计决策包括用容器级配置替代主机依赖,以及统一与不一致的sysctl应用,可能反映不同测试场景的需求差异。

2026-04-01
基础设施 重要性 3.00 洞察度 3.00

优化单元测试日志清理逻辑,解决残留日志和空目录问题。

该 PR 变更聚焦于 CI 脚本优化,逻辑清晰且风险低。对于关注 CI 流程和测试隔离的工程师,值得快速浏览以了解日志清理的最佳实践;对于其他开发者,无需深入阅读。

参与讨论