执行摘要
- 一句话:更新 NPU 文档,新增
--enable-adaptive-dispatch-to-encoder 参数说明
- 推荐动作:建议阅读以了解 NPU 文档维护流程和参数表格规范。但该 PR 技术含量低,无需深入精读。
功能与动机
根据 Issue#354 报告,Ascend NPU 文档中缺少 --enable-adaptive-dispatch-to-encoder 参数的说明,该参数控制多模态请求的自适应分发:单图请求由语言模型实例本地处理,多图请求分发给远程编码器服务器。文档缺失导致用户无法了解这一重要配置选项。
实现拆解
- 定位文档文件:修改
docs/platforms/ascend/ascend_npu_support_features.md 中的“Encode prefill disaggregation”参数表格。
- 新增参数行:在表格中增加一行,列出
--enable-adaptive-dispatch-to-encoder 参数,默认值为 False,选项为布尔标志,支持的服务器为 A2、A3。
- 优化描述文本:对原有的
--encoder-only、--language-only、--encoder-urls 等参数添加更详细的描述文字(例如 --encoder-only 的选项描述从 "set to enable" 改为 "set to launch an encoder-only server"),提升用户可读性。
关键文件:
docs/platforms/ascend/ascend_npu_support_features.md(模块 文档;类别 docs;类型 documentation): 唯一修改文件,新增了 --enable-adaptive-dispatch-to-encoder 参数说明并优化了描述。
关键符号:未识别
评论区精华
Review 中 Gemini Code Assist 机器人建议为布尔标志参数添加更详细的帮助文本(如来自 server_args.py 的描述),以提升用户体验。该建议未在后续提交中体现,但 PR 最终被 Approve 并合并。
- 参数描述详细程度 (documentation): 建议被提出但未采纳,PR 已合并。
风险与影响
- 风险:无技术风险,仅文档更新,不涉及任何代码变更。潜在问题是描述文本可能仍需进一步优化以与代码中的帮助信息保持一致。
- 影响:影响范围仅限于 Ascend NPU 用户,使其能够明确了解
--enable-adaptive-dispatch-to-encoder 参数的用途和配置方式。无功能影响。
- 风险标记:暂无
关联脉络
参与讨论