Linux下VFP NEON浮点编译

http://blog.csdn.net/liujia2100/article/details/27236477

NEON:SIMD(Single Instruction Multiple Data 单指令多重数据) 指令集，其针对多媒体和讯号处理程式具备标准化的加速能力。

VFP: (Vector Float Point), 向量浮点运算单元，arm11（s3c6410 支持VFPv2），Cortex-A8（s5pv210）支持VFPv3.

NEON和VFPv3 浮点协处理器共享寄存器组，所以在汇编时，指令是一样的。

编译选项：

-mfpu = name（neon or vfpvx）指定FPU 单元

-mfloat-abi = name（soft、hard、 softfp）：指定软件浮点或硬件浮点或兼容软浮点调用接口

如果只指定 -mfpu，那么默认编译不会选择选择硬件浮点指令集

如果只指定 -mfloat-abi = hard或者softfp，那么编译会使用硬件浮点指令集

测试C文件

int main(void)
{
float f1, f2, f3;
f1 = 1.2;
f2 = 1.3;
f3 = f1 / f2;
return 0;
}

1、 arm-eabi-gcc -S hello.c -mfpu=neon

.arch armv5te
.fpu softvfp
.eabi_attribute 20, 1
.eabi_attribute 21, 1
.eabi_attribute 23, 3
.eabi_attribute 24, 1
.eabi_attribute 25, 1
.eabi_attribute 26, 2
.eabi_attribute 30, 6
.eabi_attribute 18, 4
.file "hello.c"
.global __aeabi_fdiv
.text
.align 2
.global main
.type main, %function
main:
.fnstart
.LFB0:
@ args = 0, pretend = 0, frame = 16
@ frame_needed = 1, uses_anonymous_args = 0
stmfd sp!, {fp, lr}
.save {fp, lr}
.LCFI0:
.setfp fp, sp, #4
add fp, sp, #4
.LCFI1:
.pad #16
sub sp, sp, #16
.LCFI2:
ldr r3, .L3 @ float
str r3, [fp, #-16] @ float
ldr r3, .L3+4 @ float
str r3, [fp, #-12] @ float
ldr r0, [fp, #-16] @ float
ldr r1, [fp, #-12] @ float
bl __aeabi_fdiv
mov r3, r0
str r3, [fp, #-8] @ float
mov r3, #0
mov r0, r3
sub sp, fp, #4
ldmfd sp!, {fp, pc}
.L4:
.align 2
.L3:
.word 1067030938
.word 1067869798
.LFE0:
.fnend
.size main, .-main
.ident "GCC: (Sourcery G++ Lite 2009q3-67) 4.4.1"
.section .note.GNU-stack,"",%progbits

2、 arm-eabi-gcc -S hello.c -mfpu=vfp

.arch armv5te
.fpu softvfp
.eabi_attribute 20, 1
.eabi_attribute 21, 1
.eabi_attribute 23, 3
.eabi_attribute 24, 1
.eabi_attribute 25, 1
.eabi_attribute 26, 2
.eabi_attribute 30, 6
.eabi_attribute 18, 4
.file "hello.c"
.global __aeabi_fdiv
.text
.align 2
.global main
.type main, %function
main:
.fnstart
.LFB0:
@ args = 0, pretend = 0, frame = 16
@ frame_needed = 1, uses_anonymous_args = 0
stmfd sp!, {fp, lr}
.save {fp, lr}
.LCFI0:
.setfp fp, sp, #4
add fp, sp, #4
.LCFI1:
.pad #16
sub sp, sp, #16
.LCFI2:
ldr r3, .L3 @ float
str r3, [fp, #-16] @ float
ldr r3, .L3+4 @ float
str r3, [fp, #-12] @ float
ldr r0, [fp, #-16] @ float
ldr r1, [fp, #-12] @ float
bl __aeabi_fdiv
mov r3, r0
str r3, [fp, #-8] @ float
mov r3, #0
mov r0, r3
sub sp, fp, #4
ldmfd sp!, {fp, pc}
.L4:
.align 2
.L3:
.word 1067030938
.word 1067869798
.LFE0:
.fnend
.size main, .-main
.ident "GCC: (Sourcery G++ Lite 2009q3-67) 4.4.1"
.section .note.GNU-stack,"",%progbits

可以看到上面两个例子，使用的是 .fpu softvfp

3、 arm-eabi-gcc -S hello.c -mfpu=neon -mfloat-abi=hard

.arch armv5te
.eabi_attribute 27, 3
.eabi_attribute 28, 1
.fpu neon
.eabi_attribute 20, 1
.eabi_attribute 21, 1
.eabi_attribute 23, 3
.eabi_attribute 24, 1
.eabi_attribute 25, 1
.eabi_attribute 26, 2
.eabi_attribute 30, 6
.eabi_attribute 18, 4
.file "hello.c"
.text
.align 2
.global main
.type main, %function
main:
.fnstart
.LFB0:
@ args = 0, pretend = 0, frame = 16
@ frame_needed = 1, uses_anonymous_args = 0
@ link register save eliminated.
str fp, [sp, #-4]!
.save {fp}
.LCFI0:
.setfp fp, sp, #0
add fp, sp, #0
.LCFI1:
.pad #20
sub sp, sp, #20
.LCFI2:
flds s15, .L3
fsts s15, [fp, #-16]
flds s15, .L3+4
fsts s15, [fp, #-12]
flds s14, [fp, #-16]
flds s15, [fp, #-12]
fdivs s15, s14, s15
fsts s15, [fp, #-8]
mov r3, #0
mov r0, r3
add sp, fp, #0
ldmfd sp!, {fp}
bx lr
.L4:
.align 2
.L3:
.word 1067030938
.word 1067869798
.LFE0:
.fnend
.size main, .-main
.ident "GCC: (Sourcery G++ Lite 2009q3-67) 4.4.1"
.section .note.GNU-stack,"",%progbits

4、 arm-eabi-gcc -S hello.c -mfpu=neon -mfloat-abi=softfp

.arch armv5te
.eabi_attribute 27, 3
.fpu neon
.eabi_attribute 20, 1
.eabi_attribute 21, 1
.eabi_attribute 23, 3
.eabi_attribute 24, 1
.eabi_attribute 25, 1
.eabi_attribute 26, 2
.eabi_attribute 30, 6
.eabi_attribute 18, 4
.file "hello.c"
.text
.align 2
.global main
.type main, %function
main:
.fnstart
.LFB0:
@ args = 0, pretend = 0, frame = 16
@ frame_needed = 1, uses_anonymous_args = 0
@ link register save eliminated.
str fp, [sp, #-4]!
.save {fp}
.LCFI0:
.setfp fp, sp, #0
add fp, sp, #0
.LCFI1:
.pad #20
sub sp, sp, #20
.LCFI2:
flds s15, .L3
fsts s15, [fp, #-16]
flds s15, .L3+4
fsts s15, [fp, #-12]
flds s14, [fp, #-16]
flds s15, [fp, #-12]
fdivs s15, s14, s15
fsts s15, [fp, #-8]
mov r3, #0
mov r0, r3
add sp, fp, #0
ldmfd sp!, {fp}
bx lr
.L4:
.align 2
.L3:
.word 1067030938
.word 1067869798
.LFE0:
.fnend
.size main, .-main
.ident "GCC: (Sourcery G++ Lite 2009q3-67) 4.4.1"
.section .note.GNU-stack,"",%progbits

5、 arm-eabi-gcc -S hello.c -mfpu=vfpv3 -mfloat-abi=softfp

.arch armv5te
.eabi_attribute 27, 3
.fpu vfpv3
.eabi_attribute 20, 1
.eabi_attribute 21, 1
.eabi_attribute 23, 3
.eabi_attribute 24, 1
.eabi_attribute 25, 1
.eabi_attribute 26, 2
.eabi_attribute 30, 6
.eabi_attribute 18, 4
.file "hello.c"
.text
.align 2
.global main
.type main, %function
main:
.fnstart
.LFB0:
@ args = 0, pretend = 0, frame = 16
@ frame_needed = 1, uses_anonymous_args = 0
@ link register save eliminated.
str fp, [sp, #-4]!
.save {fp}
.LCFI0:
.setfp fp, sp, #0
add fp, sp, #0
.LCFI1:
.pad #20
sub sp, sp, #20
.LCFI2:
flds s15, .L3
fsts s15, [fp, #-16]
flds s15, .L3+4
fsts s15, [fp, #-12]
flds s14, [fp, #-16]
flds s15, [fp, #-12]
fdivs s15, s14, s15
fsts s15, [fp, #-8]
mov r3, #0
mov r0, r3
add sp, fp, #0
ldmfd sp!, {fp}
bx lr
.L4:
.align 2
.L3:
.word 1067030938
.word 1067869798
.LFE0:
.fnend
.size main, .-main
.ident "GCC: (Sourcery G++ Lite 2009q3-67) 4.4.1"
.section .note.GNU-stack,"",%progbits

6、 arm-eabi-gcc -S hello.c -mfpu=vfpv3 -mfloat-abi=hard

.arch armv5te
.eabi_attribute 27, 3
.eabi_attribute 28, 1
.fpu vfpv3
.eabi_attribute 20, 1
.eabi_attribute 21, 1
.eabi_attribute 23, 3
.eabi_attribute 24, 1
.eabi_attribute 25, 1
.eabi_attribute 26, 2
.eabi_attribute 30, 6
.eabi_attribute 18, 4
.file "hello.c"
.text
.align 2
.global main
.type main, %function
main:
.fnstart
.LFB0:
@ args = 0, pretend = 0, frame = 16
@ frame_needed = 1, uses_anonymous_args = 0
@ link register save eliminated.
str fp, [sp, #-4]!
.save {fp}
.LCFI0:
.setfp fp, sp, #0
add fp, sp, #0
.LCFI1:
.pad #20
sub sp, sp, #20
.LCFI2:
flds s15, .L3
fsts s15, [fp, #-16]
flds s15, .L3+4
fsts s15, [fp, #-12]
flds s14, [fp, #-16]
flds s15, [fp, #-12]
fdivs s15, s14, s15
fsts s15, [fp, #-8]
mov r3, #0
mov r0, r3
add sp, fp, #0
ldmfd sp!, {fp}
bx lr
.L4:
.align 2
.L3:
.word 1067030938
.word 1067869798
.LFE0:
.fnend
.size main, .-main
.ident "GCC: (Sourcery G++ Lite 2009q3-67) 4.4.1"
.section .note.GNU-stack,"",%progbits

从上面可以看到，使用softfp和hard使用的指令集是一样的，都是硬件浮点， neon和vfp的区别，仅仅体现在.fpu vfpv3和.fpu neon.

7、 arm-eabi-gcc -S hello.c -mfloat-abi=hard

.arch armv5te
.eabi_attribute 27, 3
.eabi_attribute 28, 1
.fpu vfp
.eabi_attribute 20, 1
.eabi_attribute 21, 1
.eabi_attribute 23, 3
.eabi_attribute 24, 1
.eabi_attribute 25, 1
.eabi_attribute 26, 2
.eabi_attribute 30, 6
.eabi_attribute 18, 4
.file "hello.c"
.text
.align 2
.global main
.type main, %function
main:
.fnstart
.LFB0:
@ args = 0, pretend = 0, frame = 16
@ frame_needed = 1, uses_anonymous_args = 0
@ link register save eliminated.
str fp, [sp, #-4]!
.save {fp}
.LCFI0:
.setfp fp, sp, #0
add fp, sp, #0
.LCFI1:
.pad #20
sub sp, sp, #20
.LCFI2:
flds s15, .L3
fsts s15, [fp, #-16]
flds s15, .L3+4
fsts s15, [fp, #-12]
flds s14, [fp, #-16]
flds s15, [fp, #-12]
fdivs s15, s14, s15
fsts s15, [fp, #-8]
mov r3, #0
mov r0, r3
add sp, fp, #0
ldmfd sp!, {fp}
bx lr
.L4:
.align 2
.L3:
.word 1067030938
.word 1067869798
.LFE0:
.fnend
.size main, .-main
.ident "GCC: (Sourcery G++ Lite 2009q3-67) 4.4.1"
.section .note.GNU-stack,"",%progbits

当直接使用-mfloat-abi=hard时，会默认使用.fpu vfp硬件浮点。

Linux下VFP NEON浮点编译的更多相关文章

[转]Caffe在Linux下的安装，编译，实验
Caffe在Linux下的安装,编译,实验原文地址:http://www.cnblogs.com/evansyang/p/6150118.html 第一部分:Caffe 简介 caffe是有伯克利 ...
Linux下librdkafka客户端的编译运行
Linux下librdkafka客户端的编译运行 librdkafka是一个开源的Kafka客户端C/C++实现,提供了Kafka生产者.消费者接口. 由于项目需要,我要将Kafka生产者接口封装起来 ...
Linux下FFmpeg的安装编译过程【转】
本文转载自:http://www.linuxidc.com/Linux/2013-06/85628.htm 详细说下在Linux下FFmpeg的安装编译过程.参考 Ubuntu 10.04安装编译FF ...
[zhuan] linux 下 wxWidgets 安装，编译
http://blog.csdn.net/yuzhenxiong0823/article/details/7727133 wxWidgets在Linux下有wxGTK和wxX11供使用,各需要GT ...
Linux下通过源码编译安装程序
本文简单的记录了下,在linux下如何通过源码安装程序,以及相关的知识.(大神勿喷^_^) 一.程序的组成部分 Linux下程序大都是由以下几部分组成: 二进制文件:也就是可以运行的程序文件库文件: ...
linux下motion摄像头监控编译与配置
利用linxu下的开源的motion搭建嵌入式视频动态监控系统所谓移动图像监测,简单来说就是利用摄像头定点监测某个区域,当有移动物体经过时,摄像头便自动抓拍(要监测多大物体.按拍照速率都是可调的), ...
Linux 下提高make的编译效率
Linux下安装程序,一般都通过包管理器安装,但是包管理器或软件商店里的软件往往不是最新版本的,安装最新版软件时通常是下载源代码进行编译. 编译安装源代码时就离不开make了,但是make是单线程的, ...
Linux下C++/C的编译调试
这几天因为任务的原因我需要在ubuntu下编写程序.因此恶补了许多linux程序编写的知识.我分以下几个方面总结我所学的知识. gcc,g++,make命令的使用 gdb 调试 VScode的使用 c ...
在linux下用命令行编译 java的eclipse项目
由于jdk的版本问题导致在windows上编译打包好的jar包放在linux服务器上运行的时候出现一点小异常,所以决定在linux上进行一次项目编译,这有两个选择1.在相同的linux环境下安装lin ...

随机推荐

AIX 环境下ODM库同步
IBM AIX v5.3操作系统环境下有时会出现ODM库与rootvg硬盘上数据不同步的情况.使用命令lsvg -l datavg检查文件系统类型,发现显示为"???"这就表示OD ...
SQL语句优化实践
减少查询的影响结果集,避免出现全表扫描. 影响结果集是SQL优化的核心.影响结果集不是查询返回的记录数,而是查询所扫描的结果数.通过Explain或Desc分析SQL,rows列的值即为影响结果集(还 ...
Res_Orders_01需求分析
一.背景及好处为了提高餐厅的运营效率,增强餐厅各部门间的配合,减少顾客到店后的点餐.等餐及结算过程消耗的时间,降低服务员点餐失误率,进一步提高餐厅管理人员对菜品.资金的管理以及更好的掌握餐厅的全局运 ...
windbg命令----!idt
!idt扩展显示指定的中断分配表(interrupt dispatch table (IDT))中的中断服务例程(interrupt service routine (ISR)) -a 没有指定IDT ...
完整的 mime type 列表
原文地址:http://blog.csdn.net/zhaoyw2008/article/details/46647723 Suffixes applicable Media type and sub ...
-moz-transform: rotate(-5deg);
目前越来越多的浏览器兼容CSS3标准了,就连IE浏览器老大哥也开始向CSS3低头,微软宣布IE9浏览器支持更多的CSS3属性,IE9更注重 HTML5标准.不过CSS3里有一个使对象旋转的属性tran ...
转 Microsoft's Objective-C tech started on BlackBerryOS, Tizen
今天看到了这个 Microsoft's Objective-C tech started on BlackBerryOS, Tizen 见原文 http://www.osnews.com/story ...
WPF简单导航框架（Window与Page互相调用）
相当多的WPF程序都有着丰富的页面和功能,如何使程序在不同页面间转换并降低资源占用,选择适合自己的导航框架就很重要了.最近花了一点时间做了一个简单的导航框架,并在这个过程中对Window.Page.U ...
可以让电脑卡机的c++程序
#include <iostream> #include<windows.h> #include <shellapi.h> #include <stdio.h ...
未能正确加载“RoslynPackage”包
一打开新建程序或者打开项目就报错,原因是安装的组件或者模板丢失或者有问题,在这一过程加载组件必定会产生错误,以下为解决方法: 1.重命名以下文件夹C:\Users\moonlight\Local Se ...

Linux下VFP NEON浮点编译

Linux下VFP NEON浮点编译的更多相关文章

随机推荐

热门专题