本文分享自华为云社区《如何基于香橙派AIpro开发AI推理应用》，作者：昇腾CANN。

01 简介

香橙派AIpro开发板采用昇腾AI技术路线，接口丰富且具有强大的可扩展性，提供8/20TOPS澎湃算力，可广泛使用于AI边缘计算、深度视觉学习及视频流AI分析、视频图像分析、自然语言处理等AI领域。通过昇腾CANN软件栈的AI编程接口，可满足大多数AI算法原型验证、推理应用开发的需求。

AscendCL（Ascend Computing Language，昇腾计算语言）是昇腾计算开放编程框架，是对底层昇腾计算服务接口的封装，提供Device管理、Context管理、Stream管理、内存管理、模型加载与执行、算子加载与执行、媒体数据处理等API，支持C&C++、Python编程语言，能够实现深度学习推理计算、图形图像预处理、单算子加速计算等能力。

掌握了AscendCL的编程方法，就意味着可以在香橙派AIpro开发板上充分利用昇腾的算力资源，能够基于深度学习算法开发图片分类、目标检测等一系列深度学习推理计算程序。

02 开发流程

使用AscendCL开发推理应用时，开发流程大致分为以下几步：

AscendCL初始化：初始化AscendCL内部资源，为运行做准备
运行管理资源申请：申请运行时相关资源，例如计算设备
媒体数据处理：可实现抠图、缩放、视频或图片的编解码等
模型推理：包括模型加载、执行、卸载
运行管理资源释放：资源使用后及时释放
AscendCL去初始化：与初始化配对使用

首先，我们得先了解下，使用AscendCL时，经常会提到的“数据类型的操作接口” ，这是什么呢？为啥会存在？

在C/C++中，对用户开放的数据类型通常以Struct结构体方式定义、以声明变量的方式使用，但这种方式一旦结构体要增加成员参数，用户的代码就涉及兼容性问题，不便于维护，因此AscendCL对用户开放的数据类型，均以接口的方式操作该数据类型，例如，调用某个数据类型的Create接口创建该数据类型、调用Get接口获取数据类型内参数值、调用Set接口设置数据类型内的参数值、调用Destroy接口销毁该数据类型，用户无需关注定义数据类型的结构体长什么样，这样即使后续数据类型需扩展，只需增加该数据类型的操作接口即可，也不会引起兼容性问题。

所以，总结下，“数据类型的操作接口”就是创建数据类型、Get/Set数据类型中的参数值、销毁数据类型的一系列接口，存在的最大好处就是减少兼容性问题。

接下来，进入我们今天的主题，怎么用AscendCL的接口开发网络模型推理场景下的应用。看完本文介绍的关键知识点，也可以到 “昇腾文档中心[2]”查阅详细的文档介绍。

03 AscendCL初始化与去初始化

使用AscendCL接口开发应用时，必须先初始化AscendCL ，否则可能会导致后续系统内部资源初始化出错，进而导致其它业务异常。在初始化时，还支持以下跟推理相关的配置项（例如，性能相关的采集信息配置），以json格式的配置文件传入AscendCL初始化接口。如果当前的默认配置已满足需求（例如，默认不开启性能相关的采集信息配置），无需修改，可向AscendCL初始化接口中传入NULL，或者可将配置文件配置为空json串（即配置文件中只有{}）。

有初始化就有去初始化，在确定完成了AscendCL的所有调用之后，或者进程退出之前，需调用AscendCL接口实现AscendCL去初始化。

// 此处以伪代码的形式展示接口的调用流程

// 初始化

// 此处的..表示相对路径，相对可执行文件所在的目录，例如，编译出来的可执行文件存放在out目录下，此处的..就表示out目录的上一级目录

const char *aclConfigPath = "../src/acl.json";

aclError ret = aclInit(aclConfigPath);

// ......

// 去初始化

ret = aclFinalize();

04 运行管理资源申请与释放

运行管理资源包括Device、Context、Stream、Event等，此处重点介绍Device、Context、Stream，其基本概念如下图所示。

您需要按顺序依次申请如下运行管理资源：Device、Context、Stream，确保可以使用这些资源执行运算、管理任务。所有数据处理都结束后，需要按顺序依次释放运行管理资源：Stream、Context、Device。

在申请运行管理资源时，Context、Stream支持隐式创建和显式创建两种申请方式。

// 此处以伪代码的形式展示接口的调用流程，以显式创建Context和Stream为例

// 运行管理资源申请

// 1、指定运算的Device

aclError ret = aclrtSetDevice(deviceId);

// 2、显式创建一个Context，用于管理Stream对象

ret = aclrtCreateContext(context, deviceId);

// 3、显式创建一个Stream，用于维护一些异步操作的执行顺序，确保按照应用程序中的代码调用顺序执行任务

ret = aclrtCreateStream(stream);

//......

// 运行管理资源释放

// 1、销毁Stream

ret = aclrtDestroyStream(stream);

// 2、销毁Context

ret = aclrtDestroyContext(context);

// 3、释放Device资源

ret = aclrtResetDevice(deviceId);

//......

05 媒体数据处理

如果模型对输入图片的宽高要求与用户提供的源图不一致，AscendCL提供了媒体数据处理的接口，可实现抠图、缩放、格式转换、视频或图片的编解码等，将源图裁剪成符合模型的要求。后续期刊中会展开说明这个功能，本期着重介绍模型推理的部分，以输入图片满足模型的要求为例。

06 模型加载

模型推理场景下，必须要有适配昇腾AI处理器的离线模型（*.om文件），我们可以使用ATC（Ascend Tensor Compiler）来构建模型。如果模型推理涉及动态Batch、动态分辨率等特性，需在构建模型增加相关配置。关于如何使用ATC来构建模型，请参见“昇腾文档中心[2]”。

有了模型，就可以开始加载了，当前AscendCL支持以下几种方式加载模型：

从*.om文件中加载模型数据，由AscendCL管理内存
从*.om文件中加载模型数据，由用户自行管理内存
从内存中加载模型数据，由AscendCL管理内存
从内存中加载模型数据，由用户自行管理内存

由用户自行管理内存时，需关注工作内存、权值内存。工作内存用于存放模型执行过程中的临时数据，权值内存用于存放权值数据。这个时候，是不是有疑问了，我怎么知道工作内存、权值内存需要多大？不用担心，AscendCL不仅提供了加载模型的接口，同时也提供了“根据模型文件获取模型执行时所需的工作内存和权值内存大小”的接口，方便用户使用。

// 此处以伪代码的形式展示接口的调用流程，以“由用户管理内存”为例

// 1.根据om模型文件获取模型执行时所需的权值内存大小、工作内存大小。

aclError ret = aclmdlQuerySize(omModelPath, &modelWorkSize,

                      &modelWeightSize);

// 2.根据工作内存大小，申请Device上模型执行的工作内存。

ret = aclrtMalloc(&modelWorkPtr, modelWorkSize,

          ACL_MEM_MALLOC_HUGE_FIRST);

// 3.根据权值内存的大小，申请Device上模型执行的权值内存。

ret = aclrtMalloc(&modelWeightPtr, modelWeightSize,

          ACL_MEM_MALLOC_HUGE_FIRST);

// 4.以从om模型文件加载模型、由用户管理工作内存和权值内存为例

// 模型加载成功，返回标识模型的ID。

ret = aclmdlLoadFromFileWithMem(modelPath, &modelId, modelWorkPtr,

                             modelWorkSize, modelWeightPtr,

modelWeightSize);

07 模型执行

在调用AscendCL接口进行模型推理时，模型推理有输入、输出数据，输入、输出数据需要按照AscendCL规定的数据类型存放。相关数据类型如下：

使用aclmdlDesc类型的数据描述模型基本信息（例如输入/输出的个数、名称、数据类型、Format、维度信息等）。

模型加载成功后，用户可根据模型的ID，调用该数据类型下的操作接口获取该模型的描述信息，进而从模型的描述信息中获取模型输入/输出的个数、内存大小、维度信息、Format、数据类型等信息。

使用aclDataBuffer类型的数据来描述每个输入/输出的内存地址、内存大小。

调用aclDataBuffer类型下的操作接口获取内存地址、内存大小等，便于向内存中存放输入数据、获取输出数据。

使用aclmdlDataset类型的数据描述模型的输入/输出数据。

模型可能存在多个输入、多个输出，调用aclmdlDataset类型的操作接口添加多个aclDataBuffer类型的数据。

// 此处以伪代码的形式展示如何准备模型的输入、输出数据结构

// 1.根据加载成功的模型的ID，获取该模型的描述信息

aclmdlDesc *modelDesc = aclmdlCreateDesc();

aclError ret = aclmdlGetDesc(modelDesc, modelId);

// 2.准备模型推理的输入数据结构

// (1)申请输入内存

// 当前示例代码中的模型只有一个输入，所以index为0，如果模型有多个输入，则需要先调用aclmdlGetNumInputs接口获取模型输入的数量

void *modelInputBuffer = nullptr;

size_t modelInputSize = aclmdlGetInputSizeByIndex(modelDesc, 0);

ret = aclrtMalloc(&modelInputBuffer, modelInputSize,                                              ACL_MEM_MALLOC_NORMAL_ONLY);

// (2)准备模型的输入数据结构

// 创建aclmdlDataset类型的数据，描述模型推理的输入

aclmdlDataset *input = aclmdlCreateDataset();

aclDataBuffer *inputData = aclCreateDataBuffer(modelInputBuffer, modelInputSize);

ret = aclmdlAddDatasetBuffer(input, inputData);

// 3.准备模型推理的输出数据结构

// (1)创建aclmdlDataset类型的数据output，描述模型推理的输出

aclmdlDataset *output = aclmdlCreateDataset();

// (2)获取模型的输出个数.

size_t outputSize = aclmdlGetNumOutputs(modelDesc);

// (3)循环为每个输出申请内存，并将每个输出添加到aclmdlDataset类型的数据中

for (size_t i = 0; i < outputSize; ++i) {

size_t buffer_size = aclmdlGetOutputSizeByIndex(modelDesc, i);

void *outputBuffer = nullptr;

 ret = aclrtMalloc(&outputBuffer, buffer_size,

              ACL_MEM_MALLOC_NORMAL_ONLY);

aclDataBuffer *outputData = aclCreateDataBuffer(outputBuffer, buffer_size);

ret = aclmdlAddDatasetBuffer(output, outputData);

}

准备好模型执行所需的输入和输出数据类型、且存放好模型执行的输入数据后，可以执行模型推理了，如果模型的输入涉及动态Batch、动态分辨率等特性，则在模型执行前，还需要调用AscendCL接口告诉模型本次执行时需要用的Batch数、分辨率等。

当前AscendCL支持同步模型执行、异步模型执行两种方式，这里说的同步、异步是站在调用者和执行者的角度。

若调用模型执行的接口后需等待推理完成再返回，则表示模型执行是同步的。当用户调用同步模型执行接口后，可直接从该接口的输出参数中获取模型执行的结果数据，如果需要推理的输入数据量很大，同步模型执行时，需要等所有数据都处理完成后，才能获取推理的结果数据。
若调用模型执行的接口后不等待推理完成完成再返回，则表示模型执行是异步的。当用户调用异步模型执行接口时，需指定Stream（Stream用于维护一些异步操作的执行顺序，确保按照应用程序中的代码调用顺序在Device上执行），另外，还需调用aclrtSynchronizeStream接口阻塞程序运行，直到指定Stream中的所有任务都完成，才可以获取推理的结果数据。如果需要推理的输入数据量很大，异步模型执行时，AscendCL提供了Callback机制，触发回调函数，在指定时间内一旦有推理的结果数据，就获取出来，达到分批获取推理结果数据的目的，提高效率。

// 此处以伪代码的形式展示同步模型执行的过程

// 1. 由用户自行编码，将模型所需的输入数据读入内存

// 如果模型推理之前先进行媒体数据处理，则此处可以将媒体数据处理后的输出内容作为模型推理的输入内存，

// ......

// 2. 执行模型推理

// modelId表示模型ID，在模型加载成功后，会返回标识模型的ID

// input、output分别表示模型推理的输入、输出数据，在准备模型推理的输入、输出数据结构时已定义

aclError ret = aclmdlExecute(modelId, input, output)

// 3. 处理模型推理的输出数据

for (size_t i = 0; i < aclmdlGetDatasetNumBuffers(output); ++i) {

//获取每个输出的内存地址和内存大小

aclDataBuffer* dataBuffer = aclmdlGetDatasetBuffer(output, i);

void* data = aclGetDataBufferAddr(dataBuffer);

size_t len = aclGetDataBufferSizeV2(dataBuffer);

//获取到输出数据后，由用户自行编码，处理输出数据

//......

}

// 4.销毁模型输入、输出数据结构

// 释放输入资源，包括数据结构和内存

(void)aclDestroyDataBuffer(dataBuffer);

(void)aclmdlDestroyDataset(mdlDataset);

// 5.释放内存资源，防止内存泄露

// ......

推理结束后，如果需要获取并进一步处理推理结果数据，则由用户自行编码实现。最后，别忘了，我们还要销毁aclmdlDataset、aclDataBuffer等数据类型，释放相关内存，防止内存泄露。

08 模型卸载

在模型推理结束后，还需要通过aclmdlUnload接口卸载模型，并销毁aclmdlDesc类型的模型描述信息、释放模型运行的工作内存和权值内存。

// 此处以伪代码的形式展示模型卸载的过程

// 1. 卸载模型

aclError ret = aclmdlUnload(modelId);

// 2. 释放模型描述信息

(void)aclmdlDestroyDesc(modelDesc);

// 3. 释放模型运行的工作内存和权值内存

(void)aclrtFree(modelWorkPtr);

(void)aclrtFree(modelWeightPtr);

09 更多介绍

[1]香橙派AIpro开源样例代码：https://gitee.com/ascend/EdgeAndRobotics

[2]昇腾文档中心：https://www.hiascend.com/zh/document

[3]香橙派AIpro学习资源一站式导航：https://www.hiascend.com/forum/thread-0285140173361311056-1-1.html

点击关注，第一时间了解华为云新鲜技术~

手把手带你用香橙派AIpro开发AI推理应用的更多相关文章

基于昇腾计算语言AscendCL开发AI推理应用
摘要:本文介绍了昇腾计算语言AscendCL的基本概念,并以示例代码的形式介绍了如何基于AscendCL开发AI推理应用,最后配以实际的操作演示说明如何编译运行应用. 本文分享自华为云社区<基于 ...
带你从0到1开发AI图像分类应用
摘要:通过一个垃圾分类应用的开发示例,介绍AI Gallery在AI应用开发流程中的作用. 本文分享自华为云社区<AI Gallery:从0到1开发AI图像分类应用>,作者: yd_269 ...
Java开发不懂Docker，学尽Java也枉然，阿里P8架构师手把手带你玩转Docker实战
转: Java开发不懂Docker,学尽Java也枉然,阿里P8架构师手把手带你玩转Docker实战 Docker简介 Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一 ...
Android性能优化：手把手带你全面实现内存优化
前言在 Android开发中,性能优化策略十分重要本文主要讲解性能优化中的内存优化,希望你们会喜欢目录 1. 定义优化处理应用程序的内存使用.空间占用 2. 作用避免因不正确使用内 ...
Android：手把手带你深入剖析 Retrofit 2.0 源码
前言在Andrroid开发中,网络请求十分常用而在Android网络请求库中,Retrofit是当下最热的一个网络请求库今天,我将手把手带你深入剖析Retrofit v2.0的源码,希望你们会喜 ...
Android零基础入门第3节：带你一起来聊一聊Android开发环境
原文:Android零基础入门第3节:带你一起来聊一聊Android开发环境工欲善其事,必先利其器.Android开发人员在自己的计算机上编写和测试应用程序,然后将其部署到实际的设备上,那首先必不可 ...
[转帖]从零开始入门 K8s | 手把手带你理解 etcd
从零开始入门 K8s | 手把手带你理解 etcd https://zhuanlan.zhihu.com/p/96721097 导读:etcd 是用于共享配置和服务发现的分布式.一致性的 KV 存储系 ...
GitHub 热点速览 Vol.26：手把手带你做数据库
作者:HelloGitHub-小鱼干摘要:手把手带你学知识,应该是学习新知识最友好的姿势了.toyDB 虽然作为一个"玩具"项目不能应用在实际开发中,但通过它你可以了解到如何制作 ...
手把手带你体验鸿蒙 harmonyOS
wNlRGd.png 前言本文已经收录到我的 Github 个人博客,欢迎大佬们光临寒舍: 我的 GIthub 博客学习导图 image.png 一.为什么要尝鲜 harmonyos? wNlfx ...
2022年写的香橙派 OrangePi Zero 用python获取dht11温度和湿度
感谢网上资料和个人的不放弃,终于方便的解决了香橙派 OrangePi Zero用python获取dht11温湿度的问题. 网上关于香橙派的资料比起树莓派真是少之又少,现在香橙派zero能干的活暂时也只 ...

随机推荐

Oracle 10gR2新SQL提示——opt_param
[English] 搜索Internet 搜索 HelloDBABA 首页 English 中文技术文档文章案例产品及下载产品 >> FyDB OraTracer FySafe ...
Java I/O 教程（六） BufferedInputStream 类
Java BufferedInputStream Class Java BufferedInputStream class 用于从输入流读取数据,和BufferedOutStream一样内部使用缓冲机 ...
如何基于three.js(webgl)引擎架构，实现3D密集架库房,3D档案室（3d机器人取档、机器人盘点、人工查档、设备巡检）
前言: 这是最好的时代,也是最坏的时代:是充满挑战的时代,也是充满机遇的时代.是科技飞速的时代,也是无限可能的时代. 近年来,人工智能(AI)技术的飞速发展已经席卷了全球,不断突破着技术边界,为各行 ...
Innodb之事务
目录一.事务基本概念事务的特性:ACID 事务类型 1.扁平事务 2.带保存点的扁平事务 3.链式事务 4.嵌套事务 5.分布式事务二.事务的实现概述三.redo log 1)组成 2)red ...
【Android逆向】脱壳项目frida_dump 原理分析
脱dex核心文件dump_dex.js 核心函数 function dump_dex() { var libart = Process.findModuleByName("libart.so ...
pikachu sql inject bool盲注
输入框中输入已知用户名 kobe 显示了用户信息 your uid:3 your email is: kobe@pikachu 输入kobe'看一下情况显示您输入的username不存在,请重新 ...
centos8.x阿里源配置
>>> cd /etc/yum.repo.d >>> mkdir bak >>> mv *.repo bak/ >>> cd b ...
【LeetCode排序专题02】最小k个数，关于快速排序的讨论
最小k个数 https://leetcode.cn/problems/smallest-k-lcci/ 输入整数数组 arr ,找出其中最小的 k 个数.例如,输入4.5.1.6.2.7.3.8这8个 ...
【生成对抗网络学习其二】GAN（keras实现）代码阅读笔记
想来想去还是记录一下吧,主要是怕以后时间长忘了好记性不如烂笔头代码来自eriklindernoren的开源GAN实现:https://github.com/eriklindernoren/Kera ...
为Study.BlazorOne引入Study.Trade模块
# 1.在Application项目中添加Trade的对应的包默认的源多半是nuget.org 我们自己的模块,一般在我们自己的NuGet服务器从"已安装"切换到"浏 ...

手把手带你用香橙派AIpro开发AI推理应用