可执行程序工作原理##

编译链接的过程###

示例程序hello.c
#include<stdio.h>
void main()
{
printf("Hello world\n");
}
  • gcc过程:ESC iso -E代表预处理,生成.i文件,主要是删除.c里的注释文件。-S代表编译,生成.s文件,主要是将代码翻译成汇编语言。-c代表汇编,生成.o文件,即elf格式文件。
  • 编译时,gcc首先要检查代码的规范性,是否有语法错误等,以确定代码实际要做的工作,在检查无误后,gcc就把代码翻译成汇编语言,对应指令为-S,会生成.s文件,.s文件中以.开头的都是伪指令。链接是将各种代码和数据部分收集起来并组合成为一个单一文件的过程,这个文件可被加载到内存中并执行。通俗的说,链接就是把多个文件拼接到一起,本质上是节的拼接。
  • 链接从过程上讲分为符号解析和重定位两部分,根据链接时机的不同,又分为静态链接和动态链接。
  • 符号包含全局变量和全局函数,例如printf就是一个符号,hello程序需要在函数库中找到这个符号。重定位是把程序的逻辑地址空间转换成内存中的实际物理地址空间的过程。
  • 符号表记录了目标文件中所有的全局函数及其地址;重定位表中记录了所有调用这些函数的代码位置。
  • 静态链接是指在编译链接时直接将需要的执行代码复制到最终可执行文件中。
  • 动态链接是指编译时不直接复制可执行代码,而是通过记录一系列符号和参数,在程序运行或加载时将这些信息传递给操作系统。

ELF可执行文件格式###

ELF(Executable and Linkable Format)即可执行的和可链接的格式,是一个目标文件格式的标准,即ELF是一种标准!!!ELF格式的文件用于存储Linux程序。ELF是一种对象文件的格式,用于定义不同类型的对象文件中都有什么内容,以什么样的格式放这些内容。

ELF文件有3种类型,第一种是可重定位文件,一般是中间文件,由编译器和汇编器创建,一个源代码文件会生成一个可重定位文件。例如编译.c文件时会生成.o文件,该文件即为可重定位目标文件。第二种是可执行文件,一般由多个可重定位文件结合生成,是完成了所有重定位工作和符号解析(除了运行时解析的共享库符号)的文件。第三种是共享目标文件,指可以被可执行文件或其他库文件使用的目标文件。linux下就是后缀为.so的文件。

ELF文件格式如下图

Linux内核如何装载和启动一个可执行程序###

Linux提供了execl、execlp、execle、execv、execvp和execve等6个用以执行一个可执行文件的函数,这些函数的本质都是调用exec.c文件中实现的系统调用sys_execve()来执行一个可执行文件。

实验:使用gdb跟踪分析一个execve系统调用内核处理函数sys_execve##

1.首先将menu文件夹更新一下,用test_execve.c覆盖test.c,然后make rootfs启动menu os

cd LinuxKernel
rm -rf menu
git clone https://github.com/mengning/menu.git
cd menu
mv test_execve.c test.c
make rootfs

在menuos下输入exec可以看到结果



2.开始调试,并在

  • sys_execve
  • load_elf_binary
  • start_thread

设置断点,然后输入c执行,此时在menuos输入exec,当执行到如图所示处,可以查看一下new_ip的内存地址,是0x8048d0a





3.readelf -h hello查看一下hello这个可执行文件的头,入口点地址是0x8048d0a,和new_ip是一样的





4.继续c,直到执行完毕,实验结束