android ARM 汇编学习—— 在 android 设备上编译c/cpp代码并用objdump/readelf等工具分析

adb putty 连上手机,用busybox vi 写一个 helloworld c

root@HM2014813:/data/local/tmp # busybox vi hello.c

#include <stdio.h>

int main(int argc, char* argv[])
{
  printf("Hello ARM World\n");
  return 0;
}

用 gcc 编译成汇编,并查看

root@HM2014813:/data/local/tmp # gcc hello.c -S && cat ./hello.s

  .arch armv5te
.fpu softvfp
.eabi_attribute 20, 1
.eabi_attribute 21, 1
.eabi_attribute 23, 3
.eabi_attribute 24, 1
.eabi_attribute 25, 1
.eabi_attribute 26, 2
.eabi_attribute 30, 6
.eabi_attribute 34, 0
.eabi_attribute 18, 4
.file "hello.c"
.section .rodata
.align 2
.LC0:
.ascii "Hello ARM World\000"
.text
.align 2
.global main
.type main, %function
main:
@ args = 0, pretend = 0, frame = 8
@ frame_needed = 1, uses_anonymous_args = 0
stmfd sp!, {fp, lr}
add fp, sp, #4
sub sp, sp, #8
str r0, [fp, #-8]
str r1, [fp, #-12]
ldr r3, .L3
.LPIC0:
add r3, pc, r3
mov r0, r3
bl puts(PLT)
mov r3, #0
mov r0, r3
sub sp, fp, #4
@ sp needed
ldmfd sp!, {fp, pc}
.L4:
.align 2
.L3:
.word .LC0-(.LPIC0+8)
.size main, .-main
.ident "GCC: (GNU) 4.8.2"
.section .note.GNU-stack,"",%progbits

下面开始分析:

.arch armv5te
.fpu softvfp
.eabi_attribute 20, 1
.eabi_attribute 21, 1
.eabi_attribute 23, 3
.eabi_attribute 24, 1
.eabi_attribute 25, 1
.eabi_attribute 26, 2
.eabi_attribute 30, 6
.eabi_attribute 34, 0
.eabi_attribute 18, 4
.file "hello.c"

开始这几行是给 ARM cpu 的声明,.arch 指明体系架构类型, .fpu 指明 Floating Point Unit  浮点运算单元的运算模式,接下去几行是  ARM Embedded Application Binary Interface EABI 的 option, 最后一行指明文件名称

 .section        .rodata
.align 2
.LC0:
.ascii "Hello ARM World\000"

c code 里的字符串 "Hello ARM World\n" 编译后存入 .rodata section 。

 .text
.align 2
.global main
.type main, %function
main:

上面这几行是函数声明,在 .text section , 函数名是 main

.LC0:
.ascii "Hello ARM World\000" ; label .LC0 对应的内存地址存放字符串,或者说 .LC0 存放的是字符串的首地址
.text
.align 2
.global main
.type main, %function
stmfd   sp!, {fp, lr}   ; 压栈,栈向地地址生长,sp 保存着栈顶地址, fp 是帧指针,lr 是返回地址
               ; fp : 在C程序编译过程中,函数局部变量被分配在一个连续存储区内,这个连续存储区就是该函数的帧
               ; 这句指令效果是,帧指针被保存在栈顶位置,lr 指针被保存在地址为 (fp - 4Byte) 的位置上(因为一条指令是4Byte),然后sp生长2个指针长度,即往低地址移动 8 个字节 add fp, sp, #4 ; fp = sp + 4
sub sp, sp, #8 ; sp = sp - 8, 这一句和接下来给 r0,r1赋值的两句都没看懂
str r0, [fp, #-8]
str r1, [fp, #-12]
ldr r3, .L3 ; 将 label .L3 的值赋给 r3 , .L3 是一个label, 可以理解为一个地址, 这个地址是这么算的 .LC0-(.LPIC0+8)
              ; .LC0 是要打印的字符串的地址, .LPIC0 其实是指令 ‘add r3,pc,r3’ 的地址, +8 即往前越2条指令,所以其实是指令 'bl puts(PLT)' 的地址,即调用printf函数的地址
              ; 结合起来看, .L3 保存的是要打印的字符串的地址和跳转指令的地址的 offset, 这个 offset 的作用是? 这个 offset 加上 pc 之后就是字符串的地址
.LPIC0:
add r3, pc, r3 ; ArmV5 的流水线是3,意味着执行这条指令的时候,pc 的值指向的指令是 bl puts(PLT), r3 即 .L3 , 加起来就是要打印的字符串的地址
mov r0, r3 ; 将字符串地址保存在 r0
bl puts(PLT) ; 打印
mov r3, #0
mov r0, r3 ; return 0
sub sp, fp, #4
@ sp needed
ldmfd sp!, {fp, pc} ; 恢复pc寄存器,跳出函数
.L4:
.align 2
.L3:
.word .LC0-(.LPIC0+8)
.size main, .-main
.ident "GCC: (GNU) 4.8.2"
.section .note.GNU-stack,"",%progbits

上面这个过程比较难理解的是,传给printf的字符串的地址是动态算出来的,  .LC0-(.LPIC0+8) + pc ,为什么这么做,网上找了个大概靠谱的解释:http://tieba.baidu.com/p/2983668645

ARM立即数在我的印象里最大是4096再大就只能相对寻址,显然所有的指针都只能间接寻址,也就是需要一个内存来存地址那就是L3。。。。L3是个常量,存LPIC0到字符串LC0的相对位置,只要PC+该相对位置就是字符串位置,因为ARM9是3级流水线一次区取条指令,你当前的PC位置并不是紧接的下一条,而是下3条的位置,通常单片机是1级流水线当前PC就是下条的位置,不用加减任何数,但ARM9需要+8 如果是ARM11的五级流水线加的更多。。。。
ARM不能像单片机那样,想取某个标签地址,就可以 mov r1,#标签 因为ARM立即数寻址有限制。。。所有的指针都会超过限制,所以会用另一种方式直接算出寻址位置的地址和
全局变量位置的相对地址,在调用时用PC+相对地址即可 但要 PC+(相对地址-8), 因为
仪的在减号后面的括号里面所以 按结合律规则 -8编程+8

参考 :

Android ARM Assembly: Registers, Memory and Addressing Modes

ARMv7匯編代碼分析

android ARM 汇编学习 —— hello world的更多相关文章

  1. android ARM 汇编学习—— 在 android 设备上编译c/cpp代码并用objdump/readelf等工具分析

    学习 android 逆向分析过程中,需要学习 Arm 指令,不可避免要编写一些 test code 并分析其指令,这是这篇文档的背景. 在目前 android 提供的开发环境里,如果要编写 c / ...

  2. arm汇编学习(五)

    新增个手写GNU语法arm的方法,以后可以狂逆狂写 hello.S文件 .data msg: .ascii "Hello, ARM!\n" len = . - msg .text ...

  3. arm汇编学习(四)

    一.android jni实现1.静态实现jni:先由Java得到本地方法的声明,然后再通过JNI实现该声明方法.2.动态实现jni:先通过JNI重载JNI_OnLoad()实现本地方法,然后直接在J ...

  4. arm汇编学习(三)

    一.ndk编译android上运行的c程序 新建个hello目录,底下要有jni目录,下面就是Android.mk文件 1.Android.mk文件内容如下: LOCAL_PATH:= $(call ...

  5. ARM汇编学习笔记

    ARM  RISC  (Reduced Instruction Set Computers) X86   CISC  (Complex Instruction Set Computers)      ...

  6. Android ARM指令学习

    在逆向分析Android APK的时候,往往需要分析它的.so文件.这个.so文件就是Linux的动态链接库,只不过是在ARM-cpu下编译的.所以学习Android下的ARM指令很重要.目前,市面上 ...

  7. arm汇编学习(六)---跳转到thumb状态

    通常函数返回使用 pop {r7,pc}或bx lr等方式(bx,b类似jmp为跳转指令,但bx可以指定跳转区域究竟为thumb还是arm指令.thumb指令指令的时候,直接填写该地址却总是产生SIG ...

  8. ARM 汇编学习笔记

  9. ARM学习笔记11——GNU ARM汇编程序设计

    GNU ARM汇编程序设计中,每行的语法格式如下: [<label>:] [<instruction | directive | pseudo-instruction>] @c ...

随机推荐

  1. Windows Server 2008 R2(x64) IIS7+PHP5(FastCGI)环境搭建

    相关软件下载: 1.PHP下载地址: http://windows.php.net/downloads/releases/php-5.4.4-nts-Win32-VC9-x86.zip 如果是win2 ...

  2. 创建vpc网络

    vpc相关功能点: 模块 功能点 描述 备注 VPC 创建vpc网络 创建vpc网络,指定vpc网络名称   修改vpc网络 修改vpc网络名称   删除vpc网络 删除vpc网络   vpc相关命令 ...

  3. python——pyinstaller生成exe基本使用和遇到的坑

    1.安装 pip install pyinstaller 2.常规操作 在cmd界面(之前安装python或者anaconda的时候正确添加环境变量的话,是可以在cmd界面直接执行pyinstalle ...

  4. TF-IDF与主题模型 - NLP学习(3-2)

    分词(Tokenization) - NLP学习(1) N-grams模型.停顿词(stopwords)和标准化处理 - NLP学习(2) 文本向量化及词袋模型 - NLP学习(3-1) 在上一篇博文 ...

  5. Hyperledger04

    代码 'use strict'; var Fabric_Client = require('fabric-client'); var path = require('path'); var util ...

  6. java设计模式之观察者模式以及在java中作用

    观察者模式是对象的行为模式,又叫发布-订阅(Publish/Subscribe)模式.模型-视图(Model/View)模式.源-监听器(Source/Listener)模式或从属者(Dependen ...

  7. 正则匹配java多行注释

    类似: /** * This method was generated by MyBatis Generator. * This method returns the value of the dat ...

  8. 从微软msdn阅读事件的使用

    微软文章:如何:在 Windows 窗体应用程序中使用事件 地址:https://msdn.microsoft.com/zh-cn/library/0y0987sc.aspx 文章:C#事件的订阅与触 ...

  9. 使用 TListView 控件(2)

    本例效果图: 代码文件: unit Unit1; interface uses   Windows, Messages, SysUtils, Variants, Classes, Graphics, ...

  10. [bzoj 2818]欧拉函数

    题目链接:http://www.lydsy.com/JudgeOnline/problem.php?id=2818 枚举最大公约数,对于每一个质数p,只需要求出1<=x,y<=(n/p)范 ...