Prhub

#22697 [NPU] update npu doc

原始 PR 作者 zhsurpass 合并时间 2026-04-13 21:55 文件变更 1 提交数 3 评论 1 代码增减 +7 / -6

执行摘要

更新 NPU 文档,新增 `--enable-adaptive-dispatch-to-encoder` 参数说明

根据 Issue#354 报告,Ascend NPU 文档中缺少 --enable-adaptive-dispatch-to-encoder 参数的说明,该参数控制多模态请求的自适应分发:单图请求由语言模型实例本地处理,多图请求分发给远程编码器服务器。文档缺失导致用户无法了解这一重要配置选项。

建议阅读以了解 NPU 文档维护流程和参数表格规范。但该 PR 技术含量低,无需深入精读。

讨论亮点

Review 中 Gemini Code Assist 机器人建议为布尔标志参数添加更详细的帮助文本(如来自 server_args.py 的描述),以提升用户体验。该建议未在后续提交中体现,但 PR 最终被 Approve 并合并。

实现拆解

  1. 定位文档文件:修改 docs/platforms/ascend/ascend_npu_support_features.md 中的“Encode prefill disaggregation”参数表格。
  2. 新增参数行:在表格中增加一行,列出 --enable-adaptive-dispatch-to-encoder 参数,默认值为 False,选项为布尔标志,支持的服务器为 A2、A3。
  3. 优化描述文本:对原有的 --encoder-only--language-only--encoder-urls 等参数添加更详细的描述文字(例如 --encoder-only 的选项描述从 "set to enable" 改为 "set to launch an encoder-only server"),提升用户可读性。
文件 模块 状态 重要度
docs/platforms/ascend/ascend_npu_support_features.md 文档 modified 2.26

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

参数描述详细程度 documentation

Gemini Code Assist 机器人建议为布尔标志参数添加更详细的帮助文本,提升用户体验。

结论:建议被提出但未采纳,PR 已合并。 · unresolved

风险与影响

无技术风险,仅文档更新,不涉及任何代码变更。潜在问题是描述文本可能仍需进一步优化以与代码中的帮助信息保持一致。

影响范围仅限于 Ascend NPU 用户,使其能够明确了解 --enable-adaptive-dispatch-to-encoder 参数的用途和配置方式。无功能影响。

关联 Issue

#354 [Bug] [Doc] [SIT] Missing documentation for --enable-adaptive-dispatch-to-encoder parameter in Encode Prefill Disaggregation section

完整报告

参与讨论