执行摘要
新增 Ascend NPU 精度评估与 FAQ 文档
根据 PR 描述,目的是为 NPU 用户提供标准化的精度评估流程指导和常见问题排障参考,降低 NPU 平台使用门槛。
可直接合并。建议 NPU 用户精读精度评估文档以了解推荐流程,一线支持人员参考 FAQ 快速定位问题。后续可补充更多场景的 FAQ 条目。
无实质 review 讨论。PR 由 sglang-npu-bot 直接审批合并。
根据 PR 描述,目的是为 NPU 用户提供标准化的精度评估流程指导和常见问题排障参考,降低 NPU 平台使用门槛。
可直接合并。建议 NPU 用户精读精度评估文档以了解推荐流程,一线支持人员参考 FAQ 快速定位问题。后续可补充更多场景的 FAQ 条目。
无实质 review 讨论。PR 由 sglang-npu-bot 直接审批合并。
ascend_npu_accuracy_evaluation.mdx):详细说明环境搭建、使用 EvalScope 进行在线文本/多模态评估、使用 AISBench 进行离线评估,并提供命令示例。ascend_npu_faq.mdx):收集 PD 分离下的 context corruption 错误、graph 模式 acnn 错误、高并发长序列问题等,给出禁用 overlap 调度等解决方案,并附环境变量说明。docs.json):在 Ascend NPU 分组页面列表中插入两个新页面的路由。.codespellrc):添加单词 'tbe',避免拼写检查误报。| 文件 | 模块 | 状态 | 重要度 |
|---|---|---|---|
docs_new/docs/hardware-platforms/ascend-npus/ascend_npu_accuracy_evaluation.mdx |
文档 | added | 5.22 |
docs_new/docs/hardware-platforms/ascend-npus/ascend_npu_faq.mdx |
文档 | added | 5.42 |
docs_new/docs.json |
配置 | modified | 2.68 |
分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。
当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。
低风险。仅涉及文档和配置文件,无代码变动。风险主要集中在文档内容的准确性,尤其是环境变量、命令参数和解决方案的正确性,若官方验证不充分可能误导用户。FAQ 中的临时方案(如禁用 overlap 调度)需注明已知问题状态。
对 NPU 用户有正面影响:提供官方精度评估流程和常见问题排障路径,减少对支持团队的依赖。对系统其他模块无影响。文档导航更新确保用户可发现新内容。
当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。
参与讨论