1. NDK支持NEON环境配置:https://blog.csdn.net/app_12062011/article/details/50462351
  2. 一个很典型的例子:http://hilbert-space.de/?p=22
    neon android ndkhttps://github.com/Lakers2005

一、入门

1. 并行操作模式的模式[Mapping,Reduce,Scatter,Stencil]

2. NEON指令使用举例,NEON指令提供的核心能力有数据的装载、存储以及数据的处理。NEON指令都是以V字母开头。

  1. VADD.I16 q0, q1, q2

其中,V表示NEON指令头,ADD为加法运算,I表示整形,I16表示16位整形,q0,q1,q2都是128位寄存器。指令的意思是让q1,q2装载8个16位数据,然后执行加法操作,最后放倒q0寄存器中,一次指令完成了8此加法运算,也就性能提升了8倍。

如果把RGB三个元素分别放到3个不同的寄存器中,每个寄存器的元素分别都是R、G、B,这样就可以进行并行晕算了。

二、NDK中如何使用NEON

1. 确认处理器是否支持NEON

  1. cat /proc/cpuinfo | grep neon

2. 引入头文件arm_neon.h

  1. #include <arm_neon.h>

3. 修改CMakeList.txt

  1. # make a list of neon files and add neon compiling flags to them
  2. set(neon_SRCS helloneon-intrinsics.c)
  3. set_property(SOURCE ${neon_SRCS} APPEND_STRING PROPERTY COMPILE_FLAGS " -mfpu=neon")
  4. add_library(hello-neon SHARED helloneon.c ${neon_SRCS})

4. c代码

  1. void reference_convert(uint8_t *__restrict dest, uint8_t *__restrict src, int n) {
  2. int i;
  3. for (i = ; i < n; i++) {
  4. int r = *src++; // load red
  5. int g = *src++; // load green
  6. int b = *src++; // load blue
  7.  
  8. // build weighted average:
  9. int y = (r * ) + (g * ) + (b * );
  10.  
  11. // undo the scale by 256 and write to memory:
  12. *dest++ = (y >> );
  13. }
  14. }
  15.  
  16. //使用NEON Intrinsics优化
  17. void neon_convert(uint8_t *__restrict dest, uint8_t *__restrict src, int n) {
  18. int i;
  19. //读取8字节的预设值到64位寄存器
  20. uint8x8_t rfac = vdup_n_u8();// 转换权值 R
  21. uint8x8_t gfac = vdup_n_u8();// 转换权值 G
  22. uint8x8_t bfac = vdup_n_u8();// 转换权值 B
  23. n /= ;
  24.  
  25. for (i = ; i < n; i++) {
  26. uint16x8_t temp;
  27. uint8x8x3_t rgb = vld3_u8 (src);//一次读取3个unit8x8到3个64位寄存器
  28. uint8x8_t result;
  29.  
  30. temp = vmull_u8(rgb.val[], rfac); // temp=rgb.val[0]*rfac
  31. temp = vmlal_u8(temp, rgb.val[], gfac);// temp=temp+rgb.val[1]*gfac
  32. temp = vmlal_u8(temp, rgb.val[], bfac);//temp=temp+rgb.val[2]*bfac
  33.  
  34. result = vshrn_n_u16 (temp, ); // 128位寄存器每16位右移第二个参数位
  35. vst1_u8 (dest, result); // 转存运算结果到dest
  36. src += * ;
  37. dest += ;
  38. }
  39. }

NEON优化之《简介》的更多相关文章

  1. 解决一个Ubuntu中编译NEON优化的OpenCV的错误

    在Ubuntu 16中编译开启NEON优化的Opencv时,遇到libpng编译是使用汇编代码的错误,完整错误见文章末尾.通过查询发现解决方案是安装跨平台编译器,安装代码如下: sudo apt-ge ...

  2. Oracle SQL优化器简介

    目录 一.Oracle的优化器 1.1 优化器简介 1.2 SQL执行过程 二.优化器优化方式 2.1 优化器的优化方式 2.2 基于规则的优化器 2.3 基于成本的优化器 三.优化器优化模式 3.1 ...

  3. loadrunner 脚本优化-事务时间简介

    脚本优化-事务时间简介 by:授客 QQ:1033553122 事务概念 事务是指用户在客户端做一种或多种业务所需要的操作集(actions),通过事务开始和结束函数可以标记完成该业务所需要的操作内容 ...

  4. Oracle中CBO优化器简介

    Oracle中CBO优化器简介 Oracle数据库中的优化器是SQL分析和执行的优化工具.它负责制定SQL的执行计划,也就是它负责保证SQL的执行计划的效率最高,比如优化器决定Oracle以什么样的方 ...

  5. 【Stage3D学习笔记续】山寨Starling(七):一般优化方法简介及混合模式

    关于事件的优化: 遍历注册的事件由foreach改变为fori,在大量数据遍历时会有提升: 事件池优化: 所有的事件都使用一个对象池进行保存,而不是使用到时进行创建,使用EventDispatcher ...

  6. 分享:SQL优化器简介

    SQL优化是我们经常会遇到的问题,无论你是专职的数据分析人员还是全栈开发大神或者是CURD搬运工. 我们在工作中经常会听到这样的声音:“查询慢?加个索引吧”.虽然加索引并不一定能解决问题,但是这体现了 ...

  7. SQL优化器简介

    文章导读: 什么是RBO? 什么是CBO? 我们在工作中经常会听到这样的声音:"SQL查询慢?你给数据库加个索引啊".虽然加索引并不一定能解决问题,但是这初步的体现了SQL优化的思 ...

  8. 堆优化 dijkstra 简介

    dijkstra 前言 原本我真的不会什么 dijkstra 只用那已死的 spfa ,还有各种玄学优化,可是,我不能相信一个已死的算法,就像我不能相信自己. ps : 虽然他已经活了 序 我站在镜子 ...

  9. ARM NEON指令集优化理论与实践

    ARM NEON指令集优化理论与实践 一.简介 NEON就是一种基于SIMD思想的ARM技术,相比于ARMv6或之前的架构,NEON结合了64-bit和128-bit的SIMD指令集,提供128-bi ...

随机推荐

  1. .net学习——第一个程序

    时隔3年.这个窗口 看到觉得特别亲切,舒服 昨天学了 一些概念 ref out 以及引用类型值类型.lambda  匿名方法 什么的 发现啊.当你知道 内存的 数值和对象的处理机制,js的匿名函数,钩 ...

  2. Vue 集成环信 全局封装环信WebSDK 可直接使用

    2019-11-25更新 npm install --save easemob-websdk请直接使用官方安装方式即可.import WebIM from 'easemob-websdk' 以下是最开 ...

  3. Spring Cloud Zuul 网关服务的fallback

    当我们的zuul进行路由分发时,如果后端服务没有启动,或者调用超时,这时候我们希望Zuul提供一种降级功能,而不是将异常暴露出来. Spring cloud zuul提供这种降级功能,操作步骤如下: ...

  4. 半监督的GAN算法

    ImprovedGAN $ Loss = Loss_{supervised}   + \lambda * Loss_{unsupervised} $ 第二项形式与原始的GAN模型类似. 参考: Imp ...

  5. sublime3激活方法

    激活方法参考这里 $ tail -n4 /etc/hosts # https://blog.csdn.net/DeMeng33/article/details/80536926 127.0.0.1 w ...

  6. -bash: fultter: command not found

    flutter build apk bash: flutter: command not found 在studio中的控制台出现上面错误(如图所示) 解决办法: 安装flutter时,安装时可以执行 ...

  7. PAT Advanced 1010 Radix(25) [⼆分法]

    题目 Given a pair of positive integers, for example, 6 and 110, can this equation 6 = 110 be true? The ...

  8. Python中列表的copy方法

    1.在列表中存在一个名为copy的方法,就像字面意思一样copy方法是用于复制列表元素的,示例如下: names = [‘Zhangsan’,’Lisi’,’WangErgou’] names2 = ...

  9. 理解python的可变参数

    以 str.format(*args,**kwargs) 为例. "type1:{},{},{},{}_type2:{a},{b},{c},{d}".format('a',2,*[ ...

  10. AI大火之下智能手机行业能适应这一风口吗?

    今年智能手机行业的变化,实在是让人摸不到头脑.一方面是智能手机厂商依然在拿出各种具有噱头的产品,仿佛整个市场还依然热火朝天.但在另一方面,智能手机出货量却出现大幅下滑.据中国信息通信研究院发布的数据显 ...