Prhub
← 返回仓库列表

PaddlePaddle/FastDeploy

High-performance Inference and Deployment Toolkit for LLMs and VLMs based on PaddlePaddle

监控状态:已开启 最近同步:2026-04-18 22:32 同步状态:空闲 下次计划:2026-04-18 23:32

PR 列表

已合并 179 · 已分析 179
更多筛选
2026-04-10
基础设施 重要性 4.00 洞察度 3.00

修复预编译 wheel 安装脚本并更新文档,明确 Python 3.10 限制。

建议技术管理者和工程师关注此 PR,以了解构建依赖的版本约束变化,特别是 Python 3.10 限制对用户环境的要求。值得精读 build.sh 中的版本检查逻辑,评估是否需要进一步修复;同时,可参考 review 讨论中的设计权衡,学习如何在 CI 流程中处理多架构支持。

2026-04-09
基础设施 重要性 4.00 洞察度 3.00

将9个高内存消耗测试标记为顺序执行,避免并发OOM导致的CI不稳定。

该PR值得快速浏览以了解CI测试执行优化策略,但无需深入代码细节。重点关注:1. 高风险测试的识别和分类逻辑;2. review中关于硬编码和维护性的讨论,可作为未来CI脚本改进的参考。

基础设施 重要性 4.00 洞察度 3.00

为 CI workflow 添加统一的 no_proxy 配置,提升网络访问稳定性。

这是一个简单的 CI 配置优化,对于了解 FastDeploy CI 基础设施的工程师值得一读,特别是关注环境变量配置和代理设置的部分。无需深入代码逻辑,但应注意讨论中提到的配置一致性问题。

#7259 [Feature] support nvfp4 tbo

作者 lizexu123 · 合并时间 2026-04-09 17:29

功能 重要性 5.00 洞察度 4.00

为 NVFP4 MoE 添加 TBO 支持,优化推理并发性能。

建议重点关注 TBO 在 NVFP4 MoE 中的具体优化机制,以及 let_another_thread_run 函数的实现细节(需结合 tbo 模块理解)。同时应注意清理调试代码,并考虑补充单元测试以确保变更可靠性。

#7278 [Docs]add dsk-3.2 doc

作者 chang-wenbin · 合并时间 2026-04-09 17:28

文档 重要性 3.00 洞察度 2.00

添加 DeepSeek-V3.2 模型的部署文档,覆盖中英文版本。

建议快速浏览此 PR,了解 DeepSeek-V3.2 的部署配置,特别是注意 DSA_ATTN 后端的使用、专家并行(expert-parallel)设置和量化选项(block_wise_fp8)。对于文档维护者,可关注拼写和变量一致性以避免类似错误。

#7206 add deepe precision test

作者 zhoutianzi666 · 合并时间 2026-04-09 17:23

测试 重要性 5.00 洞察度 4.00

新增 Hopper 架构 DeepEP 低延迟精度测试,验证分布式 MoE 操作的正确性。

该 PR 值得测试工程师和分布式系统开发者关注,特别是学习如何编写多 GPU 精度测试用例和代码规范实践。可以关注返回码检查逻辑的修正和版权声明的添加,以提升测试质量。

功能 重要性 6.00 洞察度 6.00

统一MoE算子实现,使用Paddle官方moe_permute路径简化代码并提高可维护性。

建议工程师精读fastdeploy/model_executor/layers/moe/fused_moe_cutlass_backend.py中的apply_tp方法,关注环境变量控制的设计决策和代码路径切换逻辑;同时注意custom_ops/gpu_ops/moe/deepgemm_preprocess.cu的性能优化点,以及测试覆盖的完整性。

#7267 [Docs] Update docs for release/2.5

作者 Jiang-Jia-Jun · 合并时间 2026-04-09 16:07

文档 重要性 3.00 洞察度 2.00

更新FastDeploy v2.5发布文档,同步中英文版本并修复安装指南。

本PR为文档更新,无需深读代码,但可关注安装指南的澄清部分(如--extra-index-url说明),这对用户正确部署有直接帮助。建议文档维护者参考此次同步流程,确保未来版本发布时中英文文档同时更新。

参与讨论