可执行程序工作原理

《庖丁解牛》第七章书本知识总结

  1. “目标文件”是指编译器生成的文件,“目标”指的是目标平台,例如x86或x64,它决定了编译器使用的机器指令集。目标文件一般也叫做ABI(应用程序二进制接口),目标文件和目标平台是二进制兼容的。二进制兼容是指该目标文件已经是适应某一种CPU体系结构上的二进制指令。
  2. ELF即可执行的和可链接的格式,是一个目标文件格式的标准,用于存储Linux程序。
  3. ELF文件的类型

经查资料,应该分类为4类:

  1. 可重定位文件(Relocatable File):保存着代码和适当的数据,用来和其它的目标文件一起来创建一个可执行文件、静态库文件或者是一个共享目标文件(主要是.o文件)
  2. 可执行文件(Executable File):保存着一个用来执行的程序,一般由多个可重定位文件结合生成,是完成了所有重定位工作和符号解析(除了运行时解析的共享库符号)的文件。
  3. 共享目标文件(Shared Object File):保存着代码和合适的数据,用来被两个链接器链接。第一个是链接编辑器(静态链接),可以和其它的可重定位和共享目标文件来创建其它的object。第二个是动态链接器,联合一个可执行文件和其它的共享目标文件来创建一个进程映象。
  4. 核心转储文件(Core Dump File):保存核心转储信息。
  1. ELF文件的主体是各种节,还有描述这些节属性的信息(Program header table和Section header table),以及ELF文件的整体描述信息(ELF header)。

  2. ELF Header会给出很多关于本ELF文件的属性信息,例如e_type体现了ELF文件类型,e_type值1、2、3、4分别代表可重定位文件、可执行文件、共享目标文件和核心转储文件。
  3. c代码的预处理、编译、汇编、链接(ESc、iso)

    gcc -E hello.c -o hello.i //预处理

    gcc -S hello.i -o hello.s //编译

    gcc -c hello.s -o hello.o //汇编

    gcc hello.o -o hello //链接

  4. readelf命令

    -a 等价于 -h -l -S -s -r -d -V -A -I

    -h 显示elf文件开始的文件头信息

    -S 显示节头信息

    -l 显示段头Program Header

    -s 显示符号表段中的项(如果有)

    -r 显示可重定位段的信息

    -H 显示readelf所支持的命令行选项
  5. 静态链接与动态链接

静态链接:在编译链接时直接将需要的执行代码复制到最终可执行文件中,优点是代码的装载速度快,执行速度也比较快,对外部环境依赖度低。缺点是如果多个应用程序使用同一库函数,会被装载多次,浪费内存。

动态链接:编译时不直接复制可执行代码,而是通过记录一系列符号和参数,在程序运行或加载时将这些信息传递给操作系统。操作系统负责将需要的动态库加载到内存中,在程序运行到指定的代码时,去共享执行内存中已经加载的动态库去执行代码,最终达到运行时链接的目的。优点是多个程序可以共享同一段代码,而不需要在磁盘上存储多个复制。缺点是在运行时加载可能会影响程序的前期执行性能,而且对使用的库依赖性较高。(分为装载时动态链接和运行时动态链接)

再使用gcc hello.o -o hello.static -static进行静态链接,发现得到的可执行程序文件大小大概是动态链接的100倍。

  1. 装载时动态链接

    使用命令gcc -shared shlibexample.c -o libshlibexample.so -m32编译装载时链接动态库libshlibexample.so

    shlibexample.h:



    shlibexample.c:

  2. 运行时动态链接

    使用命令gcc -shared dllibexample.c -o libdllibexample.so -m32编译运行时链接动态库libdllibexample.so

    dllibexample.h



    dllibexample.c

  3. 动态链接运行测试

    使用命令gcc main.c -o main -L./ -l shlibexample -ldl -m32编译测试main函数
  1. #include <stdio.h>
  2. #include "shlibexample.h"
  3. #include <dlfcn.h>
  4. int main()
  5. {
  6. printf("This is a Main program!\n");
  7. //sh
  8. printf("Calling ShardLibApi() function of libshlibexample.so!\n");
  9. SharedLibApi();
  10. //dl
  11. void * handle = dlopen ("libdllibexample.so",RTLD_NOW);
  12. if(handle == NULL)
  13. {
  14. printf("Open Lib libdllibexample.so Error:%s\n",dlerror());
  15. return FAILURE;
  16. }
  17. int (*func)(void);
  18. char * error;
  19. func = dlsym(handle,"DynamicalLoadingLibApi");
  20. if((error = dlerror()) != NULL)
  21. {
  22. printf("DynamicalLoadingLibApi not found:%s\n",error);
  23. return FAILURE;
  24. }
  25. printf("Calling DynamicalLoadingLibApi() function of libdllibexample.so!\n");
  26. func();
  27. dlclose(handle);
  28. return SUCCESS;
  29. }

在运行前,使用命令export LD_LIBRARY_PATH=$PWD将当前目录加入库文件搜索目录。

实验:使用cgdb跟踪分析execve系统调用内核处理函数sys_execve

  1. make rootfs,发现没有包含sys_wait.h,qemu命令也不适用于本机器,先添加sys_wait.h

  2. 修改Makefile

  3. 看到exec命令的运行结果

  4. 冻结,准备调试

  5. 设置断点(先设置到sys_execve,再设置其他两个)

  6. 单步走并进入函数,发现sys_execve调用了do_execve

  7. 继续运行到load_elf_binary

  8. 继续执行到start_thread

  9. 使用po new_ip查看new_ip所指向的地址,new_ip是返回到用户态的第一条指令的地址

  10. 查看hello文件的elf头部



    发现定义的入口地址与new_ip所指向的地址是一致的。
  11. 继续单步执行

总结

装载时动态链接中,模块非常明确调用某个导出函数,使得它们就像本地函数一样。这需要链接时链接那些函数所在DLL的导入库,导入库向系统提供了载入DLL时所需的信息及DLL函数定位。 但是在装载时装载过多的库又会影响程序的启动速度。

运行时动态链接中,不需要包含头文件,但需要在代码中进行读取、装载、关闭等一系列行为,比较繁琐而且增加了代码行数,出现错误的可能性也增加了。

参考资料

《庖丁解牛Linux》

ELF文件格式解析

ELF文件结构详解

2018-2019-1 20189215 《Linux内核原理与分析》第八周作业的更多相关文章

  1. 2019-2020-1 20199329《Linux内核原理与分析》第九周作业

    <Linux内核原理与分析>第九周作业 一.本周内容概述: 阐释linux操作系统的整体构架 理解linux系统的一般执行过程和进程调度的时机 理解linux系统的中断和进程上下文切换 二 ...

  2. 2019-2020-1 20199329《Linux内核原理与分析》第二周作业

    <Linux内核原理与分析>第二周作业 一.上周问题总结: 未能及时整理笔记 Linux还需要多用 markdown格式不熟练 发布博客时间超过规定期限 二.本周学习内容: <庖丁解 ...

  3. 20169212《Linux内核原理与分析》第二周作业

    <Linux内核原理与分析>第二周作业 这一周学习了MOOCLinux内核分析的第一讲,计算机是如何工作的?由于本科对相关知识的不熟悉,所以感觉有的知识理解起来了有一定的难度,不过多查查资 ...

  4. 20169210《Linux内核原理与分析》第二周作业

    <Linux内核原理与分析>第二周作业 本周作业分为两部分:第一部分为观看学习视频并完成实验楼实验一:第二部分为看<Linux内核设计与实现>1.2.18章并安装配置内核. 第 ...

  5. 2018-2019-1 20189221 《Linux内核原理与分析》第九周作业

    2018-2019-1 20189221 <Linux内核原理与分析>第九周作业 实验八 理理解进程调度时机跟踪分析进程调度与进程切换的过程 进程调度 进度调度时机: 1.中断处理过程(包 ...

  6. 2017-2018-1 20179215《Linux内核原理与分析》第二周作业

    20179215<Linux内核原理与分析>第二周作业 这一周主要了解了计算机是如何工作的,包括现在存储程序计算机的工作模型.X86汇编指令包括几种内存地址的寻址方式和push.pop.c ...

  7. 2019-2020-1 20209313《Linux内核原理与分析》第二周作业

    2019-2020-1 20209313<Linux内核原理与分析>第二周作业 零.总结 阐明自己对"计算机是如何工作的"理解. 一.myod 步骤 复习c文件处理内容 ...

  8. 2018-2019-1 20189221《Linux内核原理与分析》第一周作业

    Linux内核原理与分析 - 第一周作业 实验1 Linux系统简介 Linux历史 1991 年 10 月,Linus Torvalds想在自己的电脑上运行UNIX,可是 UNIX 的商业版本非常昂 ...

  9. 《Linux内核原理与分析》第一周作业 20189210

    实验一 Linux系统简介 这一节主要学习了Linux的历史,Linux有关的重要人物以及学习Linux的方法,Linux和Windows的区别.其中学到了LInux中的应用程序大都为开源自由的软件, ...

  10. 2018-2019-1 20189221《Linux内核原理与分析》第二周作业

    读书报告 <庖丁解牛Linux内核分析> 第 1 章 计算工作原理 1.1 存储程序计算机工作模型 1.2 x86-32汇编基础 1.3汇编一个简单的C语言程序并分析其汇编指令执行过程 因 ...

随机推荐

  1. PHP之变量

    前面的话 变量是用于临时存储值的容器.这些值可以是数字.文本,或者复杂得多的排列组合.变量在任何编程语言中都居于核心地位,理解它们是使用php的关键所在.下面将详细介绍php中的变量 [注意]关于ja ...

  2. c++11实现optional

    optional< T> c++14中将包含一个std::optional类,optional< T>内部存储空间可能存储了T类型的值也可能没有存储T类型的值.当optiona ...

  3. redis 之初体验(window)

    1 下载window版本的redis :https://github.com/MSOpenTech/redis/releases 2 解压压缩包.我的放在了E盘: E:/redis 3 程序,输入cm ...

  4. 【linux系列】vi模式下查找和替换

    一.查找 1.查找命令 /pattern<Enter> :向下查找pattern匹配字符串 ?pattern<Enter> :向上查找匹配字符串 在使用了查找命令之后,使用如下 ...

  5. LeetCode——Missing Number

    Description: Given an array containing n distinct numbers taken from 0, 1, 2, ..., n, find the one t ...

  6. js判断手机型号

    由于oppo手机自带浏览器的高度底部多了144px导航栏 所以:专门针对oppo手机做适配: var dowphone = document.getElementById("dowphone ...

  7. SSL安装方法一:在Windows Server 2008安装SSL证书(IIS 7.0)

    购买的是GlobalSign 公司的通配符域名型SSL 大致的意思就是“通配符公用名填写*.域名.com,这个下面的所有子域名是不受数量限制的,*可以换成任意字符” 1 生成数字证书签名请求文件(CS ...

  8. netty之LengthFieldBasedFrameDecoder解码器

    官方api:http://netty.io/4.1/api/io/netty/handler/codec/LengthFieldBasedFrameDecoder.html package com.e ...

  9. MariaDB登陆

    设置root密码 “mariabd”是新密码 [root@master /]# mysqladmin -u root password mariadb [root@master /]# mysql - ...

  10. Python 3 利用 Dlib 实现人脸 68个 特征点的标定

    0. 引言 利用 Dlib 官方训练好的模型 “shape_predictor_68_face_landmarks.dat” 进行 68 个点标定: 利用 OpenCv 进行图像化处理,在人脸上画出 ...