Prhub
← 返回仓库详情

标签聚合

PaddlePaddle/FastDeploy · 标签视图

标签列表

聚合结果

PD Disaggregation 相关 PR

2026-04-17

#7442 [Speculative Decoding] Add MTP logprob support for PD disaggregation

作者 Deleter-D · 合并时间 2026-04-17 21:37

功能 重要性 6.50 洞察度 5.00

为PD分离部署下的MTP投机解码新增prefill节点首token的logprob支持。

Speculative Decoding PD Disaggregation OP Feature

该PR值得精读,重点关注以下设计决策: 1. **消息结构体抽取**:将 `msgdata` 和 `batch_msgdata` 抽取到共享头文件,减少了代码重复,但宏命名存在冲突风险,可学习其重构思路。 2. **输出保存逻辑重构**:`save_output_specualate` 函数新增参数以区分prefill和decode节点,体现了PD分离架构下的模块化设计,但需注意数据一致性和参数传递的边界条件。 3. **算子语义设计**:`mtp_save_first_token_with_topk` 算子的实现展示了如何扩展现有功能(添加logprob支持),但 `cur_token_num` 计算与上游语义的冲突揭示了接口设计的重要性。 建议结合review评论,在实际部署前验证非MTP投机方法的兼容性,并补充单元测试。