@

十九、位置无关码

一、为什么需要位置无关码?

首先我们需要了解一下ARM板子的启动流程。

1. exynos 4412启动流程

  1. 首先看一下 exynos 4412 memory map :

    可知:

    iROM基地址是0x00000000

    iRAM基地址是0x02020000

这两块内存都在 SOC中。

  1. 查看exynos 4412 Booting Sequence:

位于第五章。



上图是exynos4412上电复位时的启动流程,大致如下:

<1>执行内部只读存储器iROM中的一段代码(厂家固化在里面的),这段代码主要是初始化一些系统的基本配置,比如初步时钟配置、堆栈、启动模式(对应图中的标志①)。

<2>iROM中的代码根据阶段一获取的启动模式(OM_STAT寄存器),从相应的存储介质中拷贝BL1镜像到内部静态随机存储器SRAM,BL1主要是完善系统时钟的初始化工作、内存控制器一些时序的配置。做完这些工作后把OS镜像拷贝到内存中(对应图中标志②③)。

<3>跳转到OS中执行。

SRAM只有256KB,而uboot镜像一般是超过这个大小的,也就是说它不能把完整的uboot镜像拷贝到SRAM中,因此,推测这里的拷贝方式应该还是:BL1拷贝的仅仅是uboot的一部分,这一部分除了能设置好基本的硬件运行环境外,还能把其自身(uboot镜像)完整的拷贝到内存中,然后uboot在内存中运行,完成OS镜像的拷贝和引导

一般情况下两者的地址并不相同,程序在DRAM中的地址重定位过程必须由程序员来完成。

这样就有了位置无关代码的概念,指代码不在连接时指定的运行地址空间,也可以执行,它一段加载到任意地址空间都能执行的特殊代码。

uboot搬移到DRAM中,然后跳转到DRAM继续运行uboot剩下的代码,那么在搬移之前的这段代码必须是位置无关,而且不能使用绝对寻址指令,否则寻址就会出错。

二、怎么实现位置无关码?

1. 什么是《编译地址》?什么是《运行地址》?

编译地址:

32位的处理器,它的每一条指令是4个字节,以4个字节存储顺序,进行顺序执行,CPU是顺序执行的,只要没发生什么跳转,它会顺序进行执行, 编译器会对每一条指令分配一个编译地址,这是编译器分配的,在编译过程中分配的地址,我们称之为编译地址。

运行地址:

是指程序指令真正运行的地址,是由用户指定的,用户将运行地址烧录到哪里,哪里就是运行的地址。

比如有一个指令的编译地址是0x40008000,实际运行的地址是0x40008000,如果用户将指令烧到0x60000000上,那么这条指令的运行地址就是0x60000000。

当编译地址和运行地址不同的时候会出现什么结果?

结果是不能跳转,编译后会产生跳转地址,如果实际地址和编译后产生的地址不相等,那么就不能跳转。

C语言编译地址:

都希望把编译地址和实际运行地址放在一起的,但是汇编代码因为不需要做C语言到汇编的转换,可以直接的去写地址,所以直接写的就是他的运行地址,这就是为什么任何bootloader刚开始会有一段汇编代码,因为起始代码编译地址和实际地址不相等,这段代码和汇编无关,跳转用的运行地址。

2. 举例

实现位置无关码主要考虑以下两个方面:

1. 位置无关的函数跳转
2. 位置无关的常量访问

下面我们通过两个例子详细讲解。

3. 代码

编译代码使用的连接文件map.lds如下:

OUTPUT_FORMAT("elf32-littlearm", "elf32-littlearm", "elf32-littlearm")
/*OUTPUT_FORMAT("elf32-arm", "elf32-arm", "elf32-arm")*/
OUTPUT_ARCH(arm)
ENTRY(_start)
SECTIONS
{
. = 0x40008000;
. = ALIGN(4);
.text :
{
gcd.o(.text)
*(.text)
}
. = ALIGN(4);
.rodata :
{ *(.rodata) }
. = ALIGN(4);
.data :
{ *(.data) }
. = ALIGN(4);
.bss :
{ *(.bss) }
}

如文件map.lds所示:0x40008000就是链接地址,

其他源文件如下:

gcd.s

.text
.global _start
_start:
ldr sp,=0x70000000 /*get stack top pointer*/
bl func
ldr pc,=func
b main
func:
mv pc,lr

main.c

/*
* main.c
*
* Created on: 2020-12-12
* Author: 一口Linux
*/
int aaaa=0;
int main(void)
{
aaaa = 0x11;
while(1);
return 0;
}

Makefile

TARGET=gcd
TARGETC=main
all:
arm-none-linux-gnueabi-gcc -O1 -g -c -o $(TARGETC).o $(TARGETC).c
arm-none-linux-gnueabi-gcc -O1 -g -c -o $(TARGET).o $(TARGET).s
arm-none-linux-gnueabi-gcc -O1 -g -S -o $(TARGETC).s $(TARGETC).c
arm-none-linux-gnueabi-ld $(TARGETC).o $(TARGET).o -Tmap.lds -o $(TARGET).elf
arm-none-linux-gnueabi-objcopy -O binary -S $(TARGET).elf $(TARGET).bin
arm-none-linux-gnueabi-objdump -D $(TARGET).elf > $(TARGET).dis clean:
rm -rf *.o *.elf *.dis *.bin

反汇编文件gcd.dis

如上图所示:

  1. _start对应的链接地址是0x40008000
  2. 9行 bl func对应的指令
  3. 10行 ldr pc,=pc对应的指令
  4. func的链接地址0x40008010
  5. 全局变量aaaa对应的内存位于bss段0x4000802c
  6. 19行 aaaa = 0x11 赋值语句对应的机器码

如果我们将生成的bin文件拷贝到内存0x40008000位置运行必然没有问题,

bl func 和 ldr pc,=func 都能跳转到func函数,
而19行代码,也能访问到全局变量aaaa。

如果我们将该程序拷贝到其他地址是否能正常运行呢?

假定我们拷贝到0地址运行,那么程序的执行地址需要从0开始重新编排,即_start对应0地址,main对应0x18。

拷贝到0地址后内存布局:



拷贝到0地址运行后,内存中指令(机器码)的内容还和以前一样,

pc的值会根据实际运行地址重新修正。

  1. 首先看bl func

对应的汇编代码是 第9行;

该指令的机器码是0xeb000001,

我们在《4. 从0开始学ARM-ARM指令,移位、数据处理、BL、机器码》讲过该机器码格式

是从pc的位置向前偏移1条指令

因为三级流水线,所以应该往下偏移3条指令,即func的位置,

所以bl仍然可以正确找到func这个函数。

  1. ldr pc,=func

    对应的汇编代码是 第10行;



我们可以看到是从pc值+4位置取出对应的内存的值,pc值+4是14,该位置对应15行,

即将40008010写入到pc,

而我们的bin文件只有44个字节大小,所以此时内存40008010并没有我们编写的任何代码。

所以ldr pc,=func 无法跳转到func。

  1. c访问全局变量aaaa

对应的汇编代码是 第19行;

我们可以看到是从pc值+4位置取出对应的内存的值,pc值+4是28,该位置对应22行,

即将4000802c写入到r3,然后20行会将r2中值写入到0x4000802c这个地址,

而此时该地址并不是全局变量aaaa,

所以此指令是无法找到bss段的aaaa变量的内存。

四、总结

1. 位置无关码:

CPU取指时用相对地址取指令(比如pc +4),只要其相对地址没有变,都能够取指并运行。即该段代码无论放在内存的哪个地址,都能正确运行。究其原因,是因为代码里没有使用绝对地址,都是相对地址。

2. 位置相关码:

利用绝对地址取指并运行,这就需要你存放程序(链接过程中)需要按照连接脚本的要求那样执行(Makefile里面有 -Ttext xxx指定或连接脚本)。

即它的地址与代码处于的位置相关,是绝对地址,如:mov PC ,#0xff;ldr pc,=0xffff等。

3. 位置无关码的应用:

1). 程序在运行期间动态加载到内存;

2). 程序在不同场合与不同程序组合后加载到内存(共享的动态链接库);

3). 在运行期间不同地址相互之间的映射(如bootloader)

4. 结论

  1. 使用mov pc ,xxx ; ldr pc ,xxx等就是位置相关码。这些使用绝对指令寻址。
  2. 而使用bl ,b ,adr,ldr一般为位置无关码。
  3. 在使用b, bl调用C语言中的函数里不要使用全局变量,因为C中全局变量的地址也是根据链接地址生成的。
  4. 使用=和不使用=号是有很大区别的。

    无=号:取该标号处的值,位置无关

    有=号:取该标号的地址,位置相关

五、思考题

考一考大家为什么uboot的异常向量表的reset异常,指令是b reset,而其他异常却是我们本文所说的位置相关码,ldr pc,XXXXXX?

arm对应的uboot异常向量表如下:

arch/arm/cpu/armv7/start.S

15. 从0开始学ARM-位置无关码的更多相关文章

  1. 汇编指令-位置无关码(BL)与绝对位置码(LDR)(2)

    位置无关码,即该段代码无论放在内存的哪个地址,都能正确运行.究其原因,是因为代码里没有使用绝对地址,都是相对地址.  位置相关码,即它的地址与代码处于的位置相关,是绝对地址 BL :带链接分支跳转指令 ...

  2. 代码重定位和位置无关码——运行于nor flash

    通过前面的学习,我们知道,把可执行程序从一个位置复制到另一个位置的过程叫做重定位. 现在有两种方式,第一种是只重定位data段到内存(sdram),为什么需要重定位?因为有些flash的写操作,不是简 ...

  3. s3c2440裸机-代码重定位、清bss的改进和位置无关码

    1.代码重定位的改进 用ldr.str代替ldrb, strb加快代码重定位的速度. 前面重定位时,我们使用的是ldrb命令从的Nor Flash读取1字节数据,再用strb命令将1字节数据写到SDR ...

  4. 韦东山yy公开课笔记(2)--汇编,段,栈,重定位/链接地址,位置无关吗

    1. 要不要学习汇编 可以只懂一点,工作中基本不用,一旦用就是出了大问题 ldr : load 读内存 ldr r0, [r1]  : r1里存放的是地址值, 去这个地址读取4字节的内容,存入r0 s ...

  5. 关于ARM指令中位置无关和位置相关代码的认识【转】

    本文转载自:https://blog.csdn.net/talent_CYJ/article/details/50533153 今天在一个问题上折腾了又是半天.就是在学JZ2440串口通信的时候,在s ...

  6. JZ2440开发笔记(9)——位置无关代码设计【转】

    b MAIN 和 ldr pc,=MAIN 的区别(谈到代码位置无关性) 看bootloader的时候经常看到这两种写法,不太明白区别,网上查了查.其实看了之后还是一头雾水? 其中,2和3 似乎是一个 ...

  7. uboot之位置无关代码解析

    在之前的话 新年过去了,那么久没有好好学习,感觉好颓废,现在就uboot的一些基础问题做一些笔记,顺便分享给大家,不过由于见识有限,如果有不足之处请多多指教. 位置无关?什么意思?我们先了解一些基础知 ...

  8. ARM裸板开发:04_MMU 链接地址与运行地址不一致时,(SDRAM)初始化程序地址无关码问题的分析

    ARM裸板开发过程,程序的链接地址设置为为0x30000000,而前期的启动代码以及相关硬件的初始化代码需要在内部iRAM(steppingstone,起始地址0x0)的4K中运行.链接地址与运行地址 ...

  9. x64共享库中的位置无关代码(PIC)

    原作者:Eli Bendersky http://eli.thegreenplace.net/2011/11/11/position-independent-code-pic-in-shared-li ...

  10. 从0系统学Android--3.6 RecyclerView

    从0系统学Android--更强大的滚动控件---RecyclerView 本系列文章目录:更多精品文章分类 本系列持续更新中.... 参考<第一行代码> 首先说明一点昨天发了一篇关于 L ...

随机推荐

  1. arm linux 移植 i2c-tools 与 简单使用

    介绍 i2c-tool是一个专门调试i2c的开源工具.可获取挂载的设备及设备地址,还可以在对应的设备指定寄存器设置值或者获取值等功能,对于驱动以及应用开发者比较友好. i2c-tool:v3.0.3 ...

  2. 三屏异显案例分享,基于全国产RK3568J工业平台!

    在工业领域中,能否更灵活.更高效地在主屏幕进行主要任务,并在其他副屏幕上进行其他次要任务(例如查看参考资料.监控其他应用程序),一直都是许多工业领域客户面临的刚需,而"多屏异显"功 ...

  3. 复习 - js基础语法

    今天继续复习了js基础语法  最后一天了 学完了进入dom bom的复习 今天发现了很多经典案例 我都不知道一个随笔放的完不 逻辑性感觉还是蛮强的 主要就是作用域 对象 内置对象等一些的操作嘛 话不多 ...

  4. python3 json.dumps(OrderDict类型) 报错:TypeError: Object of type datetime is not JSON serializable

    chatgpt给出的解决方案, 在json.dumps()函数调用中传入default参数来指定如何处理datetime对象 import json from datetime import date ...

  5. linux 查看crontab任务执行情况

    首先创建一个定时任务,例如: */1 * * * * /usr/bin/curl http://******/admin/Keeperclock/keeper >> /data/wwwro ...

  6. 暑假Java自学每日进度总结1

    今日所学: 一.常用的cmd命令: 1>盘符: 2>dir(显示当前文件所有目录) 3>cd 目录(打开该目录) 4>cd..(回到上一目录) 5>cd(回到当前盘符初始 ...

  7. Day 11 - 模拟考

    WTP 的大洗牌 题目描述 \(\text{input1}\) 3 1 1 1 1 2 3 \(\text{output1}\) 10 0 数据范围 shuffle.zip 第一题 题目描述 输入格式 ...

  8. Android Spingboot 实现SSE通信案例

    SSE SSE(Server-Sent Events)是一种用于实现服务器主动向客户端推送数据的技术,它基于 HTTP 协议,利用了其长连接特性,在客户端与服务器之间建立一条持久化连接,并通过这条连接 ...

  9. 写写Redis十大类型hyperloglog(基数统计)的常用命令

    hyperloglog处理问题的关键所在和bitmap差不多,都是为了减少对sql的写操作,提高性能,用于基数统计的算法.基数就是一种数据集,用于收集去重后内容的数量.会有0.81%的误差 hyper ...

  10. layui下拉框的数据如何直接从数据库提取(动态赋值)

    代码说明部分 第一步:先把layui官方给的模板粘到自己的前端注:下面的代码是我直接从layui官网粘过来的 <div class="layui-form-item"> ...