Linux下VFP NEON浮点编译
http://blog.csdn.net/liujia2100/article/details/27236477
NEON:SIMD(Single Instruction Multiple Data 单指令多重数据) 指令集, 其针对多媒体和讯号处理程式具备标准化的加速能力。
VFP: (Vector Float Point), 向量浮点运算单元,arm11(s3c6410 支持VFPv2),Cortex-A8(s5pv210)支持VFPv3.
NEON和VFPv3 浮点协处理器共享寄存器组,所以在汇编时,指令是一样的。
编译选项:
-mfpu = name(neon or vfpvx)指定FPU 单元
-mfloat-abi = name(soft、hard、 softfp):指定软件浮点或硬件浮点或兼容软浮点调用接口
如果只指定 -mfpu,那么默认编译不会选择选择硬件浮点指令集
如果只指定 -mfloat-abi = hard或者softfp,那么编译会使用硬件浮点指令集
测试C文件
- int main(void)
- {
- float f1, f2, f3;
- f1 = 1.2;
- f2 = 1.3;
- f3 = f1 / f2;
- return 0;
- }
1、 arm-eabi-gcc -S hello.c -mfpu=neon
- .arch armv5te
- .fpu softvfp
- .eabi_attribute 20, 1
- .eabi_attribute 21, 1
- .eabi_attribute 23, 3
- .eabi_attribute 24, 1
- .eabi_attribute 25, 1
- .eabi_attribute 26, 2
- .eabi_attribute 30, 6
- .eabi_attribute 18, 4
- .file "hello.c"
- .global __aeabi_fdiv
- .text
- .align 2
- .global main
- .type main, %function
- main:
- .fnstart
- .LFB0:
- @ args = 0, pretend = 0, frame = 16
- @ frame_needed = 1, uses_anonymous_args = 0
- stmfd sp!, {fp, lr}
- .save {fp, lr}
- .LCFI0:
- .setfp fp, sp, #4
- add fp, sp, #4
- .LCFI1:
- .pad #16
- sub sp, sp, #16
- .LCFI2:
- ldr r3, .L3 @ float
- str r3, [fp, #-16] @ float
- ldr r3, .L3+4 @ float
- str r3, [fp, #-12] @ float
- ldr r0, [fp, #-16] @ float
- ldr r1, [fp, #-12] @ float
- bl __aeabi_fdiv
- mov r3, r0
- str r3, [fp, #-8] @ float
- mov r3, #0
- mov r0, r3
- sub sp, fp, #4
- ldmfd sp!, {fp, pc}
- .L4:
- .align 2
- .L3:
- .word 1067030938
- .word 1067869798
- .LFE0:
- .fnend
- .size main, .-main
- .ident "GCC: (Sourcery G++ Lite 2009q3-67) 4.4.1"
- .section .note.GNU-stack,"",%progbits
2、 arm-eabi-gcc -S hello.c -mfpu=vfp
- .arch armv5te
- .fpu softvfp
- .eabi_attribute 20, 1
- .eabi_attribute 21, 1
- .eabi_attribute 23, 3
- .eabi_attribute 24, 1
- .eabi_attribute 25, 1
- .eabi_attribute 26, 2
- .eabi_attribute 30, 6
- .eabi_attribute 18, 4
- .file "hello.c"
- .global __aeabi_fdiv
- .text
- .align 2
- .global main
- .type main, %function
- main:
- .fnstart
- .LFB0:
- @ args = 0, pretend = 0, frame = 16
- @ frame_needed = 1, uses_anonymous_args = 0
- stmfd sp!, {fp, lr}
- .save {fp, lr}
- .LCFI0:
- .setfp fp, sp, #4
- add fp, sp, #4
- .LCFI1:
- .pad #16
- sub sp, sp, #16
- .LCFI2:
- ldr r3, .L3 @ float
- str r3, [fp, #-16] @ float
- ldr r3, .L3+4 @ float
- str r3, [fp, #-12] @ float
- ldr r0, [fp, #-16] @ float
- ldr r1, [fp, #-12] @ float
- bl __aeabi_fdiv
- mov r3, r0
- str r3, [fp, #-8] @ float
- mov r3, #0
- mov r0, r3
- sub sp, fp, #4
- ldmfd sp!, {fp, pc}
- .L4:
- .align 2
- .L3:
- .word 1067030938
- .word 1067869798
- .LFE0:
- .fnend
- .size main, .-main
- .ident "GCC: (Sourcery G++ Lite 2009q3-67) 4.4.1"
- .section .note.GNU-stack,"",%progbits
可以看到上面两个例子,使用的是 .fpu softvfp
3、 arm-eabi-gcc -S hello.c -mfpu=neon -mfloat-abi=hard
- .arch armv5te
- .eabi_attribute 27, 3
- .eabi_attribute 28, 1
- .fpu neon
- .eabi_attribute 20, 1
- .eabi_attribute 21, 1
- .eabi_attribute 23, 3
- .eabi_attribute 24, 1
- .eabi_attribute 25, 1
- .eabi_attribute 26, 2
- .eabi_attribute 30, 6
- .eabi_attribute 18, 4
- .file "hello.c"
- .text
- .align 2
- .global main
- .type main, %function
- main:
- .fnstart
- .LFB0:
- @ args = 0, pretend = 0, frame = 16
- @ frame_needed = 1, uses_anonymous_args = 0
- @ link register save eliminated.
- str fp, [sp, #-4]!
- .save {fp}
- .LCFI0:
- .setfp fp, sp, #0
- add fp, sp, #0
- .LCFI1:
- .pad #20
- sub sp, sp, #20
- .LCFI2:
- flds s15, .L3
- fsts s15, [fp, #-16]
- flds s15, .L3+4
- fsts s15, [fp, #-12]
- flds s14, [fp, #-16]
- flds s15, [fp, #-12]
- fdivs s15, s14, s15
- fsts s15, [fp, #-8]
- mov r3, #0
- mov r0, r3
- add sp, fp, #0
- ldmfd sp!, {fp}
- bx lr
- .L4:
- .align 2
- .L3:
- .word 1067030938
- .word 1067869798
- .LFE0:
- .fnend
- .size main, .-main
- .ident "GCC: (Sourcery G++ Lite 2009q3-67) 4.4.1"
- .section .note.GNU-stack,"",%progbits
4、 arm-eabi-gcc -S hello.c -mfpu=neon -mfloat-abi=softfp
- .arch armv5te
- .eabi_attribute 27, 3
- .fpu neon
- .eabi_attribute 20, 1
- .eabi_attribute 21, 1
- .eabi_attribute 23, 3
- .eabi_attribute 24, 1
- .eabi_attribute 25, 1
- .eabi_attribute 26, 2
- .eabi_attribute 30, 6
- .eabi_attribute 18, 4
- .file "hello.c"
- .text
- .align 2
- .global main
- .type main, %function
- main:
- .fnstart
- .LFB0:
- @ args = 0, pretend = 0, frame = 16
- @ frame_needed = 1, uses_anonymous_args = 0
- @ link register save eliminated.
- str fp, [sp, #-4]!
- .save {fp}
- .LCFI0:
- .setfp fp, sp, #0
- add fp, sp, #0
- .LCFI1:
- .pad #20
- sub sp, sp, #20
- .LCFI2:
- flds s15, .L3
- fsts s15, [fp, #-16]
- flds s15, .L3+4
- fsts s15, [fp, #-12]
- flds s14, [fp, #-16]
- flds s15, [fp, #-12]
- fdivs s15, s14, s15
- fsts s15, [fp, #-8]
- mov r3, #0
- mov r0, r3
- add sp, fp, #0
- ldmfd sp!, {fp}
- bx lr
- .L4:
- .align 2
- .L3:
- .word 1067030938
- .word 1067869798
- .LFE0:
- .fnend
- .size main, .-main
- .ident "GCC: (Sourcery G++ Lite 2009q3-67) 4.4.1"
- .section .note.GNU-stack,"",%progbits
5、 arm-eabi-gcc -S hello.c -mfpu=vfpv3 -mfloat-abi=softfp
- .arch armv5te
- .eabi_attribute 27, 3
- .fpu vfpv3
- .eabi_attribute 20, 1
- .eabi_attribute 21, 1
- .eabi_attribute 23, 3
- .eabi_attribute 24, 1
- .eabi_attribute 25, 1
- .eabi_attribute 26, 2
- .eabi_attribute 30, 6
- .eabi_attribute 18, 4
- .file "hello.c"
- .text
- .align 2
- .global main
- .type main, %function
- main:
- .fnstart
- .LFB0:
- @ args = 0, pretend = 0, frame = 16
- @ frame_needed = 1, uses_anonymous_args = 0
- @ link register save eliminated.
- str fp, [sp, #-4]!
- .save {fp}
- .LCFI0:
- .setfp fp, sp, #0
- add fp, sp, #0
- .LCFI1:
- .pad #20
- sub sp, sp, #20
- .LCFI2:
- flds s15, .L3
- fsts s15, [fp, #-16]
- flds s15, .L3+4
- fsts s15, [fp, #-12]
- flds s14, [fp, #-16]
- flds s15, [fp, #-12]
- fdivs s15, s14, s15
- fsts s15, [fp, #-8]
- mov r3, #0
- mov r0, r3
- add sp, fp, #0
- ldmfd sp!, {fp}
- bx lr
- .L4:
- .align 2
- .L3:
- .word 1067030938
- .word 1067869798
- .LFE0:
- .fnend
- .size main, .-main
- .ident "GCC: (Sourcery G++ Lite 2009q3-67) 4.4.1"
- .section .note.GNU-stack,"",%progbits
6、 arm-eabi-gcc -S hello.c -mfpu=vfpv3 -mfloat-abi=hard
- .arch armv5te
- .eabi_attribute 27, 3
- .eabi_attribute 28, 1
- .fpu vfpv3
- .eabi_attribute 20, 1
- .eabi_attribute 21, 1
- .eabi_attribute 23, 3
- .eabi_attribute 24, 1
- .eabi_attribute 25, 1
- .eabi_attribute 26, 2
- .eabi_attribute 30, 6
- .eabi_attribute 18, 4
- .file "hello.c"
- .text
- .align 2
- .global main
- .type main, %function
- main:
- .fnstart
- .LFB0:
- @ args = 0, pretend = 0, frame = 16
- @ frame_needed = 1, uses_anonymous_args = 0
- @ link register save eliminated.
- str fp, [sp, #-4]!
- .save {fp}
- .LCFI0:
- .setfp fp, sp, #0
- add fp, sp, #0
- .LCFI1:
- .pad #20
- sub sp, sp, #20
- .LCFI2:
- flds s15, .L3
- fsts s15, [fp, #-16]
- flds s15, .L3+4
- fsts s15, [fp, #-12]
- flds s14, [fp, #-16]
- flds s15, [fp, #-12]
- fdivs s15, s14, s15
- fsts s15, [fp, #-8]
- mov r3, #0
- mov r0, r3
- add sp, fp, #0
- ldmfd sp!, {fp}
- bx lr
- .L4:
- .align 2
- .L3:
- .word 1067030938
- .word 1067869798
- .LFE0:
- .fnend
- .size main, .-main
- .ident "GCC: (Sourcery G++ Lite 2009q3-67) 4.4.1"
- .section .note.GNU-stack,"",%progbits
从上面可以看到,使用softfp和hard使用的指令集是一样的,都是硬件浮点, neon和vfp的区别,仅仅体现在.fpu vfpv3和.fpu neon.
7、 arm-eabi-gcc -S hello.c -mfloat-abi=hard
- .arch armv5te
- .eabi_attribute 27, 3
- .eabi_attribute 28, 1
- .fpu vfp
- .eabi_attribute 20, 1
- .eabi_attribute 21, 1
- .eabi_attribute 23, 3
- .eabi_attribute 24, 1
- .eabi_attribute 25, 1
- .eabi_attribute 26, 2
- .eabi_attribute 30, 6
- .eabi_attribute 18, 4
- .file "hello.c"
- .text
- .align 2
- .global main
- .type main, %function
- main:
- .fnstart
- .LFB0:
- @ args = 0, pretend = 0, frame = 16
- @ frame_needed = 1, uses_anonymous_args = 0
- @ link register save eliminated.
- str fp, [sp, #-4]!
- .save {fp}
- .LCFI0:
- .setfp fp, sp, #0
- add fp, sp, #0
- .LCFI1:
- .pad #20
- sub sp, sp, #20
- .LCFI2:
- flds s15, .L3
- fsts s15, [fp, #-16]
- flds s15, .L3+4
- fsts s15, [fp, #-12]
- flds s14, [fp, #-16]
- flds s15, [fp, #-12]
- fdivs s15, s14, s15
- fsts s15, [fp, #-8]
- mov r3, #0
- mov r0, r3
- add sp, fp, #0
- ldmfd sp!, {fp}
- bx lr
- .L4:
- .align 2
- .L3:
- .word 1067030938
- .word 1067869798
- .LFE0:
- .fnend
- .size main, .-main
- .ident "GCC: (Sourcery G++ Lite 2009q3-67) 4.4.1"
- .section .note.GNU-stack,"",%progbits
当直接使用-mfloat-abi=hard时,会默认使用.fpu vfp硬件浮点。
Linux下VFP NEON浮点编译的更多相关文章
- [转]Caffe在Linux下的安装,编译,实验
Caffe在Linux下的安装,编译,实验 原文地址:http://www.cnblogs.com/evansyang/p/6150118.html 第一部分:Caffe 简介 caffe是有伯克利 ...
- Linux下librdkafka客户端的编译运行
Linux下librdkafka客户端的编译运行 librdkafka是一个开源的Kafka客户端C/C++实现,提供了Kafka生产者.消费者接口. 由于项目需要,我要将Kafka生产者接口封装起来 ...
- Linux下FFmpeg的安装编译过程【转】
本文转载自:http://www.linuxidc.com/Linux/2013-06/85628.htm 详细说下在Linux下FFmpeg的安装编译过程.参考 Ubuntu 10.04安装编译FF ...
- [zhuan] linux 下 wxWidgets 安装,编译
http://blog.csdn.net/yuzhenxiong0823/article/details/7727133 wxWidgets在Linux下有wxGTK和wxX11供使用,各需要GT ...
- Linux下通过源码编译安装程序
本文简单的记录了下,在linux下如何通过源码安装程序,以及相关的知识.(大神勿喷^_^) 一.程序的组成部分 Linux下程序大都是由以下几部分组成: 二进制文件:也就是可以运行的程序文件 库文件: ...
- linux下motion摄像头监控编译与配置
利用linxu下的开源的motion搭建嵌入式视频动态监控系统 所谓移动图像监测,简单来说就是利用摄像头定点监测某个区域,当有移动物体经过时,摄像头便自动抓拍(要监测多大物体.按拍照速率都是可调的), ...
- Linux 下提高make的编译效率
Linux下安装程序,一般都通过包管理器安装,但是包管理器或软件商店里的软件往往不是最新版本的,安装最新版软件时通常是下载源代码进行编译. 编译安装源代码时就离不开make了,但是make是单线程的, ...
- Linux下C++/C的编译调试
这几天因为任务的原因我需要在ubuntu下编写程序.因此恶补了许多linux程序编写的知识.我分以下几个方面总结我所学的知识. gcc,g++,make命令的使用 gdb 调试 VScode的使用 c ...
- 在linux下用命令行编译 java的eclipse项目
由于jdk的版本问题导致在windows上编译打包好的jar包放在linux服务器上运行的时候出现一点小异常,所以决定在linux上进行一次项目编译,这有两个选择1.在相同的linux环境下安装lin ...
随机推荐
- iOS7——UIControlEventTouchDown延迟响应问题
问题描述 在iOS7下开发,真机调试时,UIButton的其他事件响应都正常,但是UIControlEventTouchDown事件响应会延迟,而且不同响应区域发生的延时情况不同,有时延迟1s以后响应 ...
- Mysql中用SQL增加、删除字段,修改字段名、字段类型、注释,调整字段顺序总结
转自:http://www.111cn.net/database/mysql/71648.htm 1.增加一个字段 代码如下 复制代码 //增加一个字段,默认为空 alter table user ...
- jquery ajax 前前后后,所有的函数并查询链接
jQuery Ajax 操作函数 jQuery 库拥有完整的 Ajax 兼容套件.其中的函数和方法允许我们在不刷新浏览器的情况下从服务器加载数据. 函数 描述 jQuery.ajax() 执行异步 H ...
- 学习Linux入门50个基本命令
Linux系统以一切皆文件的方式运行系统.虽然存在ubuntu版本的图形界面,但在企业的服务器里面还是以命令行系统运行为主. 以下是初学50个基本的Linux命令行的体会 1:pwd 显示当前你所在的 ...
- 刷CM7固件 乐padA1-07专用固件
-------------------------------------------------------------------------------- 前几天在版 ...
- 关于Microsoft CRM 2013自动保存Autosave功能的10点说明
今天不经意翻看到以前记的笔记发现这个笔记觉得还是应该把它整理记录一下: 关于Microsoft CRM 2013自动保存Autosave功能的10点说明: 1.新建时不会自动保存,需要手动点击保存按钮 ...
- 《On Lisp》第四章第三节图4.6中的rmapcar函数中展现的apply陷阱
(defun rmapcar (fn &rest args) (if (some #'atom args) (apply fn args) (apply #'mapcar #'(lambda ...
- python之路-Day3
字典 dic{key:value} 元组与列表相似,唯一就是不能修改dic = {'name':'alex','age':18}查询print(dic['name']) #会报错get方法查询,查询之 ...
- jquery 中substring,substr,split的用法
substring 方法 返回位于 String 对象中指定位置的子字符串. strVariable.substring(start, end) 参数 start 指明子字符串的起始位置,该索引从 0 ...
- Java基础之OOP
1. 类(类型)于对象 (1)面向过程的开发于面向对象开发的区别: 面向过程更重视流程化以及功能的开发,简单点来讲,就是按照固定的模式一步步按部就班的进行,最终达成一个功能的实现.这种模式叫做面向过程 ...