Prhub

#25384 [NPU]Ascend NPU Performance Profiling Guide and Ascend NPU Operator Development Guide

原始 PR 作者 Hide-on-bushsh 合并时间 2026-05-21 17:32 文件变更 4 提交数 9 评论 1 代码增减 +1047 / -1

执行摘要

添加 Ascend NPU 性能分析和算子开发两份文档

PR body 明确说明『add Ascend NPU Performance Profiling Guide and Ascend NPU Operator Development Guide』,旨在补齐 Ascend NPU 平台上关键文档缺失,帮助用户进行性能分析与自定义算子开发。

对 Ascend NPU 开发者或容器部署运维人员有较高参考价值,建议精读性能分析指南中的采集方法和算子开发指南的目录结构部分。其 review 讨论虽小但体现了文档术语准确性的重要性。

讨论亮点

来自 gemini-code-assist[bot] 的 review 评论:建议将 ascend_npu.mdx 中表格的『CANN Image Tag』标签改为『Hardware Identifier』,因为 910ba3 实际为硬件标识而非完整 tag 名,与 Dockerfile 变量 DEVICE_TYPE 更一致。该建议未被合并前的对话解决,仍处于待处理状态。

实现拆解

  1. 编写 ascend_npu_profiling.mdx(+531 行):阐述 SGLang 内置 PyTorch Profiler 在 Ascend NPU 上的使用,包括环境变量、四种启动/停止方式、trace 可视化以及注意事项;
  2. 编写 ascend_npu_operator_development.mdx(+513 行):介绍 SGL-Kernel-NPU 仓库结构,分步讲解 Ascend C 算子的 host/device 开发流程,并说明 Triton 算子的集成方式,附 HelloWorld 示例;
  3. 更新 docs_new/docs.json(+2 行):在 Ascend NPU 页面列表末尾添加两个新文档的引用路径,使其在导航栏中可见;
  4. 更新 .codespellrc(+1/-1):在 ignore-words-list 中加入 'CopyIn',避免代码拼写检查误报此文档特有词汇。
文件 模块 状态 重要度
docs_new/docs/hardware-platforms/ascend-npus/ascend_npu_operator_development.mdx NPU 文档 added 7.0
docs_new/docs/hardware-platforms/ascend-npus/ascend_npu_profiling.mdx NPU 文档 added 6.02
docs_new/docs.json 文档配置 modified 2.9
.codespellrc 拼写配置 modified 2.31

关键符号

KernalHelloworld TestHelloworld test_helloworld_basic

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

表格标签命名建议:'CANN Image Tag' 改为 'Hardware Identifier' style

gemini-code-assist[bot] 指出 'CANN Image Tag' 容易误解,因为表格中的值实际表示硬件标识(如 910b、a3),建议改为 'Hardware Identifier' 以与 Dockerfile 变量 DEVICE_TYPE 一致。

结论:未在 PR 关闭前解决,评论状态仍为未解决。 · unresolved

风险与影响

无代码级风险。拼写检查忽略列表新增词汇可能掩盖该词的真正拼写错误,但概率极低。文档内容与现有功能描述无冲突。

直接影响 Ascend NPU 用户:提供性能分析工具使用指导和算子开发入门教程,可提升平台易用性。间接影响 SGLang 文档体系:补全硬件平台文档,降低 NPU 贡献门槛。影响范围局限于文档模块,无运行时影响。

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论