8. 从0学ARM-内联汇编、混合汇编、ATPCS规则
一、gcc 内联汇编
内联汇编即在C中直接使用汇编语句进行编程,使程序可以在C程序中实现C语言不能完成的一些工作,例如,在下面几种情况中必须使用内联汇编或嵌入型汇编。
- 程序中使用饱和算术运算(Saturating Arithmetic)
- 程序需要对协处理器进行操作
- 在C程序中完成对程序状态寄存器的操作
格式:
__asm__ __volatile__("asm code"
:output
:input
:changed registers);
asm或__asm__开头,小括号+分号,括号内容写汇编指令。
指令+\n\t 用双引号引上。
参数
asm code
主要填写汇编代码:
"mov r0, r0\n\t"
"mov r1,r1\n\t"
"mov r2,r2"
output(asm->C)
用于定义输出的参数,通常只能是变量:
:"constraint" (variable)
"constraint"用于定义variable的存放位置:
r 表示使用任何可用的寄存器
m 表示使用变量的内存地址
+ 可读可写
= 只写
& 表示该输出操作数不能使用输入部分使用过的寄存器,只能用"+&"或"=&"的方式使用
input(C->asm)
用于定义输入的参数,可以使变量也可以是立即数:
:"constraint" (variable/immediate)
"constraint"用于定义variable的存放位置:
r 表示使用任何可用的寄存器(立即数和变量都可以)
m 表示使用变量的内存地址
i 表示使用立即数
Note:
- 使用__asm__和__volatile__表示编译器将不检查后面的内容,而是直接交给汇编器。
- 如果希望编译器为你优化,__volatile__可以不加
- 没有asm code也不能省略""
- 没有前面的和中间的部分,不可以相应的省略:
- 没有changed 部分,必须相应的省略:
- 最后的;不能省略,对于C语言来说这是一条语句
- 汇编代码必须放在一个字符串内,且字符串中间不能直接按回车换行,可以写成多个字符串,注意中间不能有任何符号,这样就会将两个字符串合并为一个
- 指令之间必须要换行,还可以使用\t使指令在汇编中保持整齐
举例
例1:无参数,无返回值
这种情况,output和input可以省略:
asm
( //汇编指令
"mrs r0,cpsr \n\t"
"bic r0,r0,#0x80 \n\t"
"msr cpsr,r0 \n\t"
);
例2:有参数 ,有返回值
让内联汇编做加法运算,求a+b,结果存在c中
int a =100, b =200, c =0;
asm
(
"add %0,%1,%2\n\t"
: "=r"(c)
: "r"(a),"r"(b)
: "memory"
);
%0 对应变量c
%1 对应变量a
%2 对应变量b
例3:有参数 2 ,有返回值
让内联汇编做加法运算,求a+b,结果存在sum中,把a-b的存在d中
asm volatile
(
"add %[op1],%[op2],%[op3]\n\t"
"sub %[op4],%[op2],%[op3]\n\t"
:[op1]"=r"(sum),[op4]"=r"(d)
:[op2]"r"(a),[op3]"r"(b)
:"memory"
);
%0 对应变量c
%1 对应变量a
%2 对应变量b
三、ATPCS规则:(ARM、thumber程序调用规范)
为了使单独编译的C语言程序和汇编程序之间能够相互调用,必须为子程序之间的调用规定一定的规则.ATPCS就是ARM程序和THUMB程序中子程序调用的基本规则。
基本ATPCS规定了在子程序调用时的一些基本规则,包括下面3方面的内容:
- 各寄存器的使用规则及其相应的名称。
- 数据栈的使用规则。
- 参数传递的规则。
1. 寄存器的使用必须满足下面的规则:
1)子程序间通过寄存器R0一R3来传递参数,这时,寄存器R0~R3可以记作A1-A4。被调用的子程序在返回前无需恢复寄存器R0~R3的内容。
2)在子程序中,使用寄存器R4~R11来保存局部变量.这时,寄存器 R4 ~ R11可以记作V1 ~ V8。
如果在子程序中使用到了寄存器V1~V8中的某些寄存器,子程序进入时必须保存这些寄存器的值,在返回前必须恢复这些寄存器的值;对于子程序中没有用到的寄存器则不必进行这些操作。在Thumb程序中,通常只能使用寄存器R4~R7来保存局部变量。3)寄存器R12用作过程调用时的临时寄存器(用于保存SP,在函数返回时使用该寄存器出栈), 记作ip。在子程序间的连接代码段中常有这种使用规则。
4)寄存器R13用作数据栈指针,记作sp。在子程序中寄存器R13不能用作其他用途。寄存器sp在进入子程序时的值和退出子程序时的值必须相等。
5)寄存器R14称为连接寄存器,记作lr。它用于保存子程序的返回地址。如果在子程序中保存了返回地址,寄存器R14则可以用作其他用途。
6)寄存器R15是程序计数器,记作pc。它不能用作其他用途。
ATPCS下ARM寄存器的命名:
寄存器 | 别名 | 功能 |
---|---|---|
R0 | a1 | 工作寄存器 |
R1 | a2 | 工作寄存器 |
R2 | a3 | 工作寄存器 |
R3 | a4 | 工作寄存器 |
R4 | v1 | 必须保护;局部变量寄存器 |
R5 | v2 | 必须保护;局部变量寄存器 |
R6 | v3 | 必须保护;局部变量寄存器 |
R7 | v4 | 必须保护;局部变量寄存器 |
R8 | v5 | 必须保护;局部变量寄存器 |
R9 | v6 | 必须保护;局部变量寄存器 |
R10 | sl | 栈限制 |
R11 | fp | 帧指针 |
R12 | ip | 指令指针 |
R13 | sp | 栈指针 |
R14 | lr | 连接寄存器 |
2、堆栈使用规则:
ATPCS规定堆栈为FD类型,即满递减堆栈。并且堆栈的操作是8字节对齐。
而对于汇编程序来说,如果目标文件中包含了外部调用,则必须满足以下条件:
外部接口的数据栈一定是8位对齐的,也就是要保证在进入该汇编代码后,直到该汇编程序调用外部代码之间,数据栈的栈指针变化为偶数个字;
在汇编程序中使用PRESERVE8伪操作告诉连接器,本汇编程序是8字节对齐的.
3、参数的传递规则:
根据参数个数是否固定,可以将子程序分为参数个数固定的子程序和参数个数可变的子程序.这两种子程序的参数传递规则是不同的.
1.参数个数可变的子程序参数传递规则
对于参数个数可变的子程序,当参数不超过4个时,可以使用寄存器R0~R3来进行参数传递,当参数超过4个时,还可以使用数据栈来传递参数.
在参数传递时,将所有参数看做是存放在连续的内存单元中的字数据。然后,依次将各名字数据传送到寄存器R0,R1,R2,R3; 如果参数多于4个,将剩余的字数据传送到数据栈中,入栈的顺序与参数顺序相反,即最后一个字数据先入栈.
按照上面的规则,一个浮点数参数可以通过寄存器传递,也可以通过数据栈传递,也可能一半通过寄存器传递,另一半通过数据栈传递。
举例:
void func(a,b,c,d,e)
a -- r0
b -- r1
c -- r2
d -- r3
e -- 栈
2.参数个数固定的子程序参数传递规则
对于参数个数固定的子程序,参数传递与参数个数可变的子程序参数传递规则不同,如果系统包含浮点运算的硬件部件。
浮点参数将按照下面的规则传递:
(1)各个浮点参数按顺序处理;
(2)为每个浮点参数分配FP寄存器;
分配的方法是,满足该浮点参数需要的且编号最小的一组连续的FP寄存器.第一个整数参数通过寄存器R0~R3来传递,其他参数通过数据栈传递.
3、子程序结果返回规则
- 1.结果为一个32位的整数时,可以通过寄存器R0返回.
- 2.结果为一个64位整数时,可以通过R0和R1返回,依此类推.
- 3.对于位数更多的结果,需要通过调用内存来传递.
举例:
使用r0 接收返回值
int func1(int m, int n)
m -- r0
n -- r1
返回值给 r0
为什么有的编程规范要求自定义函数的参数不要超过4个?
答:因为参数超过4个就需要压栈退栈,而压栈退栈需要增加很多指令周期。
对于参数比较多的情况,我们可以把数据封装到结构体中,然后传递结构体变量的地址。
四、C语言和汇编相互调用
C和汇编相互调用要特别注意遵守相应的ATPCS规则。
1. C调用汇编
例1:c调用汇编文件中函数带返回值
简化代码如下,代码架构可以参考《7. 从0开始学ARM-GNU伪指令、代码编译,lds使用》。
;.asm
add:
add r2,r0,r1
mov r0,r2
MOV pc, lr
main.c
extern int add(int a,int b);
printf("%d \n",add(2,3));
- a->r0,b->r1
- 返回值通过r0返回计算结果给c代码
例2,用汇编实现一个strcopy函数
;.asm
.global strcopy
strcopy: ;R0指向目的字符串 ;R1指向源字符串
LDRB R2, [R1], #1 ;加载字字符并更新源字符串指针地址
STRB R2, [R0], #1 ;存储字符并更新目的字符串指针地址
CMP R2, #0 ;判断是否为字符串结尾
BNE strcopy ;如果不是,程序跳转到strcopy继续循环
MOV pc, lr ;程序返回
//.c
#include <stdio.h>
extern void strcopy(char* des, const char* src);
int main(){
const char* srcstr = "yikoulinux";
char desstr[]="test";
strcopy(desstr, srcstr);
return 0;
}
2. 汇编调用C
//.c
int fcn(int a, int b , int c, int d, int e)
{
return a+b+c+d+e;
}
;.asm ;
.text .global _start
_start:
STR lr, [sp, #-4]! ;保存返回地址lr
ADD R1, R0, R0 ;计算2*i(第2个参数)
ADD R2, R1, R0 ;计算3*i(第3个参数)
ADD R3, R1, R2 ;计算5*i
STR R3, [SP, #-4]! ;第5个参数通过堆栈传递
ADD R3, R1, R1 ;计算4*i(第4个参数)
BL fcn ;调用C程序
ADD sp, sp, #4 ;从堆栈中删除第五个参数
.end
假设程序进入f时,R0中的值为i ;
int f(int i){
return fcn(i, 2*i, 3*i, 4*i, 5*i);
}
五、其他实例
为了让读者有个更加深刻的理解, 以内核中的例子为例:
arch/arm/kernel/setup.c
void notrace cpu_init(void)
{
unsigned int cpu = smp_processor_id();----获取CPU ID
struct stack *stk = &stacks[cpu];----获取该CPU对于的irq abt和und的stack指针
……
#ifdef CONFIG_THUMB2_KERNEL
#define PLC "r"----Thumb-2下,msr指令不允许使用立即数,只能使用寄存器。
#else
#define PLC "I"
#endif __asm__ (
"msr cpsr_c, %1\n\t"----让CPU进入IRQ mode
"add r14, %0, %2\n\t"----r14寄存器保存stk->irq
"mov sp, r14\n\t"----设定IRQ mode的stack为stk->irq
"msr cpsr_c, %3\n\t"
"add r14, %0, %4\n\t"
"mov sp, r14\n\t"----设定abt mode的stack为stk->abt
"msr cpsr_c, %5\n\t"
"add r14, %0, %6\n\t"
"mov sp, r14\n\t"----设定und mode的stack为stk->und
"msr cpsr_c, %7"---回到SVC mode
:----上面是code,下面的output部分是空的
: "r" (stk),----对应上面代码中的%0
PLC (PSR_F_BIT | PSR_I_BIT | IRQ_MODE),----对应上面代码中的%1
"I" (offsetof(struct stack, irq[0])),----对应上面代码中的%2
PLC (PSR_F_BIT | PSR_I_BIT | ABT_MODE),----以此类推,下面不赘述
"I" (offsetof(struct stack, abt[0])),
PLC (PSR_F_BIT | PSR_I_BIT | UND_MODE),
"I" (offsetof(struct stack, und[0])),
PLC (PSR_F_BIT | PSR_I_BIT | SVC_MODE)
: "r14");----上面是input操作数列表,r14是要clobbered register列表
}
8. 从0学ARM-内联汇编、混合汇编、ATPCS规则的更多相关文章
- GCC内联汇编入门
原文为GCC-Inline-Assembly-HOWTO,在google上可以找到原文,欢迎指出翻译错误. 中文版说明 由于译者水平有限,故译文出错之处,还请见谅.C语言的关键字不译,一些单词或词组( ...
- [翻译] GCC 内联汇编 HOWTO
目录 GCC 内联汇编 HOWTO 原文链接与说明 1. 简介 1.1 版权许可 1.2 反馈校正 1.3 致谢 2. 概览 3. GCC 汇编语法 4. 基本内联 5. 扩展汇编 5.1 汇编程序模 ...
- 在Visual C++中使用内联汇编
一.内联汇编的优缺点 因为在Visual C++中使用内联汇编不需要额外的编译器和联接器,且可以处理Visual C++中不能处理的一些事情,而且可以使用在C/C++中的变量,所以非常方便.内联汇编主 ...
- linq介绍及工作中应用两例——左联与内联,linq循环方法
目录 1 linq介绍 1.1 linq产生背景 1.2 linq使用范围 1.3 linq核心程序集 1.4 linq架构图 1.5 linq使用形式对比 1.5.1 linq To Objects ...
- 推荐一篇讲arm架构gcc内联汇编的文章
这是来自ethernut网站的一篇文章,原文链接: http://www.ethernut.de/en/documents/arm-inline-asm.html 另外,据说nut/os是个不错的开源 ...
- ARM体系下的GCC内联汇编
转:http://andyhuzhill.github.io/arm/gcc/asm/2012/09/25/gcc-inline-assemly/ 在操作系统级的编程中,有时候,C语言并不能完全的使用 ...
- ARM嵌入式开发中的GCC内联汇编__asm__
在针对ARM体系结构的编程中,一般很难直接使用C语言产生操作协处理器的相关代码,因此使用汇编语言来实现就成为了唯一的选择.但如果完全通过汇编代码实现,又会过于复杂.难以调试.因此,C语言内嵌汇编的方式 ...
- GCC 内联汇编(GCC内嵌ARM汇编规则)
转:http://smileleeboo.howbbs.com/posts/list/3127/81062.html 更多文档参见:http://pan.baidu.com/s/1eQ7nd8Q 有时 ...
- x86平台转x64平台关于内联汇编不再支持的解决
x86平台转x64平台关于内联汇编不再支持的解决 2011/08/25 把自己碰到的问题以及解决方法给记录下来,留着备用! 工具:VS2005 编译器:cl.exe(X86 C/C+ ...
- GNU C 内联汇编介绍
GNU C 内联汇编介绍 简介 1.很早之前就听说 C 语言能够直接内嵌汇编指令.但是之前始终没有去详细了解过.最近由于某种需求,看到了相关的 C 语言代码.也就自然去简单的学习了一下如何在 C 代码 ...
随机推荐
- HTTP协议 学习:0-有关概念
HTTP协议 学习:0-有关概念 背景 实际上,HHTP协议是一种比较简单的协议,它的本质上是一个文本协议,在实际开发中,我们重点关注解析对方发来的内容的过程(字符串匹配). 参考资料: HTTP H ...
- Codeforces Round 894 (Div. 3) A-E cd 894 div3
A. Gift Carpet 每道题都是伸缩代码框有ac代码请不要漏掉 --------------------------题解----------------------------- 按先行便然后 ...
- P2872
[USACO07DEC]Building Roads S 题意描述 输入 4 1 1 1 3 1 2 3 4 3 1 4 输出 4.00 点拨 题目大意就是求最小的能把几个集合连起来的边权值之和,我们 ...
- 创建数据库时排序规则utf8_general_ci与utf8_bin的区别
在MySQL数据库中,字符集(如utf8)定义了字符如何存储,而排序规则(Collation)则定义了字符如何比较.排序和区分大小写.utf8_general_ci和utf8_bin是两种常用的UTF ...
- 深度学习 玩游戏 Q-LEARNING
游戏里面非玩家的角色行为,即 AI. 腾讯的 Ai 游戏框架:TencentOpen. 介绍: Agent,behavior tree, 大概意思就是 通过自己的框架来确定 ai 行为,然后通过 ag ...
- vue el-input只能输入正整数 替换e - + 等
示例:输入分页页数,每页显示条数 <el-input type="number" class="resNums" v-model="item.r ...
- CCF 有趣的数
问题描述: 试题编号: 201312-4 试题名称: 有趣的数 时间限制: 1.0s 内存限制: 256.0MB 问题描述: 问题描述 我们把一个数称为有趣的,当且仅当: 1. 它的数字只包含0, 1 ...
- 《最新出炉》系列入门篇-Python+Playwright自动化测试-55- 上传文件 (非input控件)- 中篇
1.简介 在实际工作中,我们进行web自动化的时候,文件上传是很常见的操作,例如上传用户头像,上传身份证信息等.所以宏哥打算按上传文件的分类对其进行一下讲解和分享. 2.上传文件的API(非input ...
- adb shell 批处理文件
adb shell 批处理文件 手机截屏,并把图片传到电脑
- 【JavaScript】从N个下拉动态监听改变的option值
同事因为这个问题人傻了,是从Ajax请求获取的动态数据遍历的表格 然后表格行的单元格又有下拉选择,有N个下拉,要取出选择的值进行二次请求 <select name="A" i ...