#7048 [Refactor] Replace --skip-mm-profiling with --deploy-modality text

PaddlePaddle/FastDeploy · 作者 kevincheng2 · 合并时间 2026-03-30 10:40

分析状态已生成

文件变更 1提交数 2 · 评论 4

代码增减 +1 / -1

Refactor APIServer

执行摘要

重构多模态 token profiling 参数，用 deploy-modality text 替代 skip-mm-profiling，简化部署配置。

原 --skip-mm-profiling 参数与 deploy-modality 参数功能存在语义重叠：当以纯文本模式部署时，本就不需要为多模态 token 预留显存。引入独立参数增加了配置复杂度，复用 deploy_modality 更加直观和一致（引用 PR body）。

建议快速浏览此 PR，以了解如何复用现有参数简化多模态部署配置。重点关注 get_max_chunk_tokens 方法的逻辑调整，作为参数整合的设计示例。

讨论亮点

Review 过程中没有实质性技术讨论，仅有 reviewer 'yuanlehome' 批准合并。Issue 评论涉及 cherry-pick 操作，未包含设计或实现细节。

实现拆解

主要修改文件为 fastdeploy/config.py。在 get_max_chunk_tokens 方法中添加条件检查 self.deploy_modality != DeployModality.TEXT，确保部署模式为 text 时跳过 mm token 叠加。PR body 中提到删除 EngineArgs.skip_mm_profiling 字段及相关启动参数，但文件列表未显示这些变更，可能已在其他提交中处理。

文件	模块	状态	重要度
`fastdeploy/config.py`	Config	modified	4.0

分析完成后，这里会展示 LLM 生成的相对完整源码片段和详细注释。

关键符号

get_max_chunk_tokens

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论，后续有更多讨论时会体现在这里。

风险与影响

回归风险：如果 deploy_modality 为 text 时逻辑不正确，可能导致显存预留不足或过剩。兼容性风险：用户需要迁移命令行参数，原 --skip-mm-profiling 不再可用，可能影响现有部署脚本。测试覆盖：PR body 指出已有单元测试覆盖，但新参数集成可能需额外验证。

对用户影响：需更新部署命令，使用 --deploy-modality text 替代 --skip-mm-profiling，影响范围限于多模态部署场景。对系统影响：减少参数数量，简化配置管理，提升代码一致性。对团队影响：此重构体现了参数设计优化，可作为类似冗余消除的参考。

配置变更迁移风险核心逻辑变更

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接，后续同步到相关引用后会出现在这里。

完整报告

执行摘要

一句话：重构多模态 token profiling 参数，用 deploy-modality text 替代 skip-mm-profiling，简化部署配置。
推荐动作：建议快速浏览此 PR，以了解如何复用现有参数简化多模态部署配置。重点关注 get_max_chunk_tokens 方法的逻辑调整，作为参数整合的设计示例。

功能与动机

实现拆解

关键文件：

fastdeploy/config.py（模块 Config）: 核心变更点，修改了 get_max_chunk_tokens 方法以整合 skip_mm_profiling 功能到 deploy_modality 参数中

关键符号：get_max_chunk_tokens

评论区精华

Review 过程中没有实质性技术讨论，仅有 reviewer 'yuanlehome' 批准合并。Issue 评论涉及 cherry-pick 操作，未包含设计或实现细节。

暂无高价值评论线程

风险与影响

风险：回归风险：如果 deploy_modality 为 text 时逻辑不正确，可能导致显存预留不足或过剩。兼容性风险：用户需要迁移命令行参数，原 --skip-mm-profiling 不再可用，可能影响现有部署脚本。测试覆盖：PR body 指出已有单元测试覆盖，但新参数集成可能需额外验证。
影响：对用户影响：需更新部署命令，使用 --deploy-modality text 替代 --skip-mm-profiling，影响范围限于多模态部署场景。对系统影响：减少参数数量，简化配置管理，提升代码一致性。对团队影响：此重构体现了参数设计优化，可作为类似冗余消除的参考。
风险标记：配置变更迁移风险, 核心逻辑变更

关联脉络

PR #7068 Cherry-pick from PR 7048: 关联 cherry-pick PR，将重构应用到 release/2.4 和 release/2.5 分支，确保变更同步

支持 Prhub ♥

#7048 [Refactor] Replace --skip-mm-profiling with --deploy-modality text

执行摘要

重构多模态 token profiling 参数，用 deploy-modality text 替代 skip-mm-profiling，简化部署配置。

实现拆解

评论区精华

没有提炼出高价值讨论线程

风险与影响

关联 Issue

未识别关联 Issue

完整报告

执行摘要

功能与动机

实现拆解

评论区精华

风险与影响

关联脉络

参与讨论