第七周 linux如何装载和启动一个可执行文件

潘恒原创作品转载请注明出处《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000

一、实验内容

1.预处理、编译和链接实践

　　ELF头部在文件的开始，描述文件的总体格式，保存了路线图，描述该文件的组织情况，即生成该文件系统的字的大小和字节顺序段头部表用来描述ELF可执行文件与连续的存储段之间的映射关系。节头表包含了描述文件节区的信息，每个节区在表中都有一个项，给出节区的名称、节区大小这类心里。用于链接的目标文件（可重定向文件）必须包含节区头部表，而可执行文件可以没有。

2.可执行程序的执行环境

命令行参数和shell环境，一般我们执行一个程序的Shell环境，我们的实验直接使用execve系统调用。

$ ls -l /usr/bin列出/usr/bin下的目录信息

Shell本身不限制命令行参数的个数，命令行参数的个数受限于命令自身

例如：

int main(int argc, char*argv[])

又如

 int main(int argc, char*argv[], char *envp[])

Shell会调用execve将命令行参数和环境参数传递给可执行程序的main函数

int execve(const char *filename,char * const argv[ ],char * const envp[ ]);

库函数exec*都是execve的封装例程

3.可执行程序的装载

（1）do_execve()

（2）search_binary_handler()

（3） load_elf_binary()

（4） load_elf_interp()

二、实验步骤及截图

更新menu内核
```
rm menu -rf
```
查看test.c文件（shift+G直接到文件尾）：可以看到新增加了exec系统调用，其源代码与之前的fork类似
启动内核并验证execv函数
冻结内核，启动GDB调试
进行调试
- 先停在sys_execve处，再设置其它断点；按c一路运行下去直到断点sys_execve
- 按s跳入函数内单步执行
退出调试状态，输入redelf -h hello可以查看hello的EIF头部

三、Linux系统加载可执行程序所需处理过程的理解

1. 新的可执行程序是从哪里开始执行的?

当execve()系统调用终止且进程重新恢复它在用户态执行时，执行上下文被大幅度改变，要执行的新程序已被映射到进程空间，从elf头中的程序入口点开始执行新程序。

如果这个新程序是静态链接的，那么这个程序就可以独立运行，elf头中的这个入口地址就是本程序的入口地址。

如果这个新程序是动态链接的，那么此时还需要装载共享库，elf头中的这个入口地址是动态链接器ld的入口地址。

2.为什么execve系统调用返回后新的可执行程序能顺利执行?

新的可执行程序执行：
1. 需要的库函数。
2. 属于它的进程空间：代码段，数据段，内核栈，用户栈等。
3. 需要的运行参数。
4. 需要的系统资源。
如果满足以上4个条件，那么新的可执行程序就会处于可运行态，只要被调度到，就可以正常执行。
条件1：如果新进程是静态链接的，那么库函数已经在可执行程序文件中，条件满足。如果是动态链接的，新进程的入口地址是动态链接器ld的起始地址，可以完成对所需库函数的加载，也能满足条件。
条件2：execve系统调用通过大幅度修改执行上下文，将用户态堆栈清空，将老进程的进程空间替换为新进程的进程空间，新进程从老进程那里继承了所需要的进程空间，条件满足。
条件3：我们一般在shell中，输入可执行程序所需要的参数，shell程序把这些参数用函数参数传递的方式传给给execve系统调用，然后execve系统调用以系统调用参数传递的方式传给sys_execve，最后sys_execve在初始化新程序的用户态堆栈时，将这些参数放在main函数取参数的位置上。条件满足。
条件4：如果当前系统中没有所需要的资源，那么新进程会被挂起，直到资源有了，唤醒新进程，变为可运行态，条件可以满足。
综上，新的可执行程序可以顺利执行。

3.对于静态链接的可执行程序和动态链接的可执行程序execve系统调用返回时会有什么不同？

execve系统调用会调用sys_execve，然后sys_execve调用do_execve，然后do_execve调用do_execve_common，然后do_execve_common调用exec_binprm。

对于ELF文件格式，fmt函数指针实际会执行load_elf_binary，load_elf_binary会调用start_thread，在start_thread中通过修改内核堆栈中EIP的值，使其指向elf_entry，跳转到elf_entry执行。
对于静态链接的可执行程序，elf_entry是新程序的执行起点。对于动态链接的可执行程序，需要先加载链接器ld，
elf_entry = load_elf_interp(…)
将CPU控制权交给ld来加载依赖库，再由ld在完成加载工作后将CPU控制权还给新进程。

四.总结

在Linux中，fork是进程创建另一个进程的唯一方法。只有第一个进程也就是被称作 init 的进程需要手工创建。所有其他进程都是用fork这个系统调用创建的。fork系统调用只是复制了父进程的数据和堆栈，并在这两个进程之间共享文本区。fork系统调用采用比较聪明的方式— 写时拷贝（copy-on-write）技术，使得fork结束后并不立刻复制父进程的内容，而是到了真正实用的时候才复制，这样使效率大大提高。fork函数创建了一个子进程后，子进程会调用exec族函数执行另外一个程序。
多进程、多用户、虚拟存储的操作系统出现以后，可执行文件的装载过程变得非常复杂。引入了进程的虚拟地址空间；然后根据操作系统如何为程序的代码、数据、堆、栈在进程地址空间中分配，它们是如何分布的；最后以页映射的方式将程序映射进程虚拟地址空间。
动态链接是一种与静态链接程序不同的概念，即一个单一的可执行文件模块被拆分成若干个模块，在程序运行时进行链接的一种方式。然后根据实际例子do_exece()分析了ELF装载的大致过程，中间实现了动态链接。

第七周 linux如何装载和启动一个可执行文件的更多相关文章

Linux内核装载和启动一个可执行程序
“平安的祝福 + 原创作品转载请注明出处 + <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 ” 理解编 ...
20135323符运锦----第七周：Linux内核如何装载和启动一个可执行程序
可执行程序的装载一.预处理.编译.链接和目标文件的格式 1.可执行程序是怎么得来的 ①编译器预处理 gcc -E -o XX.cpp XX.c (-m32)// 注:把include的文件包含进来, ...
Linux内核设计第七周 ——可执行程序的装载
Linux内核设计第七周 ——可执行程序的装载第一部分知识点总结一.预处理.编译.链接和目标文件的格式 1.可执行程序是怎么得来的编译链接的过程预处理阶段 gcc -E -o XX.cpp ...
Linux内核分析第七周可执行程序的装载
张嘉琪原创作品转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 Linux内核分析第七 ...
作业七：Linux内核如何装载和启动一个可执行程序
作业七:Linux内核如何装载和启动一个可执行程序一.编译链接的过程和ELF可执行文件格式可执行文件的创建——预处理.编译和链接在object文件中有三种主要的类型. 一个可重定位(reloca ...
实验七：Linux内核如何装载和启动一个可执行程序
原创作品转载请注明出处 + <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 题目自拟,内容围绕对Linu ...
Linux内核分析第七周学习笔记——Linux内核如何装载和启动一个可执行程序
Linux内核分析第七周学习笔记--Linux内核如何装载和启动一个可执行程序 zl + 原创作品转载请注明出处 + <Linux内核分析>MOOC课程http://mooc.study. ...
linux内核分析第七周 Linux内核如何装载和启动一个可执行程序
一.编译链接的过程和ELF可执行文件格式 vi hello.c gcc -E -o hello.cpp hello.c -m32 //预处理.c文件,预处理包括把include的文件包含进来以及宏替换 ...
Linux内核设计第七周学习总结 Linux内核如何装载和启动一个可执行程序
陈巧然原创作品转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-100002900 实验目的使用gdb跟踪s ...

随机推荐

C#中类为什么要实例化
在使用C#语言时,发现一下有关类实例化的问题,在此之前先复习一下类和对象的概念,类是一个抽象体,是对一类事物的抽象体:而对象就是一个具体的事物,对象的抽象就是类.车就是一个类,而车包括面包车,小汽车, ...
Linq2DB之研究和探索
1,对linq2db使用看法最近在研究linq2db,用起来还不错,性能还不错的.之前也在博客园有些网友说用ado.net和depper写SQL语句,性能还要高.有时候牺牲点性能,为了提高开发效率, ...
函数重载(overload)
重载的定义及特点在同一个类中,允许存在一个以上的同名函数, 只要他们的参数个数或者参数类型不同(不仅指两个重载方法的参数类型不同,还指相同参数拥有不同的参数类型顺序)就构成重载. 重载只和参数列表有 ...
数据分组、统计 case when then else end
case when 对表进行条件分组 case简单函数 case age when then select name , sex , age , ( case age /*when 条件成立 ...
ABAP 内表访问表达式的性能
内表访问表达式是ABAP 7.4中引入的重要特性,可以使语句变得更加简洁.美观.那么它的读写性能怎么样呢?我进行了一点点测试. 读取测试代码,使用三种方式读取同一内表,分别是read table关键 ...
[php] yii debug设置
最近在使用yii写rest api发现在所有错误信息都写在log文件里调试不是很直接在index.php头部查入就ok了 defined('YII_ENABLE_EXCEPTION_HANDLER' ...
WINS服务器与DNS服务器有什么区别？
1.WINS实现的是IP地址和计算机名称的映射,DNS实现的是IP地址和域名的映射.2.WINS作用的范围是某个内部网络,DNS的范围是整个互联网.简单说明一下:WINS实现的是IP地址和计算机名称的 ...
【js】 ==与===区别
1.对于string,number等基础类型,==和===是有区别的 1)不同类型间比较,==之比较“转化成同一类型后的值”看“值”是否相等,===如果类型不同,其结果就是不等 2)同类型比较,直接进 ...
leetcode 206. Reverse Linked List(剑指offer16)、
206. Reverse Linked List 之前在牛客上的写法: 错误代码: class Solution { public: ListNode* ReverseList(ListNode* p ...
Drool实战系列(一)之入门程序
Drools官网地址为:https://www.drools.org/ maven环境入门程序例子如下: 项目结构截图: 一.导入pom文件 <project xmlns="http ...

第七周 linux如何装载和启动一个可执行文件

第七周 linux如何装载和启动一个可执行文件的更多相关文章

随机推荐

热门专题