编译链接的过程

编译就是把文本形式源代码翻译为机器语言形式的目标文件过程。

链接是把目标文件、操作系统的启动代码和用到的库文件进行组织最终形成可执行代码的过程。

对于GCC来说,编译源代码并最终形成可执行的二进制文件,分为以下四个步骤:

  1. 预处理。在该阶段,编译器将C源代码中的包含的头文件如stdio.h编译进来。使用GCC的选项”-E”,生成“.i”文件。
  2. 编译阶段。在这个阶段中,Gcc首先要检查代码的规范性、是否有语法错误等,以确定代码的实际要做的工作,在检查无误后,GCC把代码翻译成汇编语言。使用”-S”选项,该选项只进行编译而不进行汇编,生成汇编代码,即“.s”文件。
  3. 汇编阶段。汇编阶段是把编译阶段生成的”.s”文件转成二进制目标代码,生成“.o”文件。
  4. 链接阶段。将“.o”文件链接成最终可执行文件。

如图所示:

ELF文件格式

ELF(Executable and Linkable Format)即可执行和可链接的格式,是一个目标文件格式标准
目标文件有三种:

  • 可重定向文件。文件保存着代码和适当的数据,用来和其他的目标文件一起来创建一个可执行文件或者是一个共享目标文件。(目标文件或者静态库文件,即linux通常后缀为.a和.o的文件)
  • 可执行文件。文件保存着一个用来执行的程序,例如bash,gcc等,一般由多个可重定位文件结合生成。
  • 共享目标文件。共享库。文件保存着代码和合适的数据,用来被下连接编辑器和动态链接器链接。(linux下后缀为.so的文件)

ELF格式的文件用于存储Linux程序,是一种对象文件的格式,用于定义不同类型的对象文件中都有什么内容、以什么样的格式放这些内容。一般的ELF文件包括三个索引表:

  • ELF header。在文件的开始,保存了路线图,描述了该文件的组织情况。
  • Program header table。告诉系统如何创建进程映像。用来构造进程映像的目标文件必须具有程序头部表,可重定位文件不需要这个表。
  • Section header table。包含了描述文件节区的信息,每个节区在表中都有一项,每一项给出诸如节区名称、节区大小这类信息。用于链接的目标文件必须包含节区头部表,其他目标文件可以有,也可以没有这个表。

ELF文件结构如图所示:

可以使用readelf命令相关选项查看文件的elf形式,如图所示:

动态链接

动态链接区别于静态链接,不会在编译链接时将需要执行的代码直接复制带最终可执行文件中,而是通过记录一系列符号和参数,在程序运行或加载时将这些信息传递给操作系统,由操作系统将需要的动态库加载到内存中。动态链接行程的可执行文件较小,但对系统环境依赖度高。
动态链接分为可执行程序装载时动态链接和运行时动态链接。

装载时动态链接

使用命令gcc -shared shlibexample.c -o libshlibexample.so -m32编译装载时链接动态库libshlibexample.so。

运行时动态链接

使用命令gcc -shared dllibexample.c -o libdllibexample.so -m32编译运行时链接动态库libdllibexample.so。

运行测试

使用命令gcc example.c -o example -L ./ -l shlibexample -ldl -m32编译测试main函数,注意将当前目录加入库文件搜索目录。

cgdb跟踪分析execve

和之前跟踪调试系统调用的步骤一样,在menuOS中进行调试。断点设置如下:

首先停在sys_execve处:

然后是load_elf_binary,按s可以细致的看到程序内部的流程:

停在start_thread处,分析发现将new_ip设置成hello的入口地址,并将new_ip赋值给regs_ip:


总结

可以看到对于装载时动态链接和运行时动态链接的代码,运行时动态链接不需要包含头文件,但需要在代码中做一系列的处理,这些处理一方面显得有些繁琐,有些影响程序可读性;另一方面也增加了出错的可能。但是在装载时加载过多库又会造成程序启动缓慢。

我们在日常生活打开电脑应用时也经常遇到某个dll文件不存在而导致应用打不开的情况,这些dll文件都是装载时链接的吗?还是说应用在装载时也会对一些必要的、运行时链接的库做是否存在的检查?在计算机存储空间比较富足的现在,装载时链接相比静态链接似乎已经没什么优势了?

2018-2019-1 20189218《Linux内核原理与分析》第八周作业的更多相关文章

  1. 2019-2020-1 20199329《Linux内核原理与分析》第九周作业

    <Linux内核原理与分析>第九周作业 一.本周内容概述: 阐释linux操作系统的整体构架 理解linux系统的一般执行过程和进程调度的时机 理解linux系统的中断和进程上下文切换 二 ...

  2. 2019-2020-1 20199329《Linux内核原理与分析》第二周作业

    <Linux内核原理与分析>第二周作业 一.上周问题总结: 未能及时整理笔记 Linux还需要多用 markdown格式不熟练 发布博客时间超过规定期限 二.本周学习内容: <庖丁解 ...

  3. 20169212《Linux内核原理与分析》第二周作业

    <Linux内核原理与分析>第二周作业 这一周学习了MOOCLinux内核分析的第一讲,计算机是如何工作的?由于本科对相关知识的不熟悉,所以感觉有的知识理解起来了有一定的难度,不过多查查资 ...

  4. 20169210《Linux内核原理与分析》第二周作业

    <Linux内核原理与分析>第二周作业 本周作业分为两部分:第一部分为观看学习视频并完成实验楼实验一:第二部分为看<Linux内核设计与实现>1.2.18章并安装配置内核. 第 ...

  5. 2018-2019-1 20189221 《Linux内核原理与分析》第九周作业

    2018-2019-1 20189221 <Linux内核原理与分析>第九周作业 实验八 理理解进程调度时机跟踪分析进程调度与进程切换的过程 进程调度 进度调度时机: 1.中断处理过程(包 ...

  6. 2017-2018-1 20179215《Linux内核原理与分析》第二周作业

    20179215<Linux内核原理与分析>第二周作业 这一周主要了解了计算机是如何工作的,包括现在存储程序计算机的工作模型.X86汇编指令包括几种内存地址的寻址方式和push.pop.c ...

  7. 2019-2020-1 20209313《Linux内核原理与分析》第二周作业

    2019-2020-1 20209313<Linux内核原理与分析>第二周作业 零.总结 阐明自己对"计算机是如何工作的"理解. 一.myod 步骤 复习c文件处理内容 ...

  8. 2018-2019-1 20189221《Linux内核原理与分析》第一周作业

    Linux内核原理与分析 - 第一周作业 实验1 Linux系统简介 Linux历史 1991 年 10 月,Linus Torvalds想在自己的电脑上运行UNIX,可是 UNIX 的商业版本非常昂 ...

  9. 《Linux内核原理与分析》第一周作业 20189210

    实验一 Linux系统简介 这一节主要学习了Linux的历史,Linux有关的重要人物以及学习Linux的方法,Linux和Windows的区别.其中学到了LInux中的应用程序大都为开源自由的软件, ...

  10. 2018-2019-1 20189221《Linux内核原理与分析》第二周作业

    读书报告 <庖丁解牛Linux内核分析> 第 1 章 计算工作原理 1.1 存储程序计算机工作模型 1.2 x86-32汇编基础 1.3汇编一个简单的C语言程序并分析其汇编指令执行过程 因 ...

随机推荐

  1. postgresql安装、可整理成一键安装PG脚本

    yum -y install gcc make readline zlib readline-devel zlib-develtar -jxvf postgresql-9.5.2.tar.bz2cd ...

  2. windows上使用logstash-input-jdbc

    (一)安装logstash 下载链接  选择下载你要的对应的logstash版本,这个东西解压就能使用了 (二)安装logstash-input-jdbc 就是用执行logstash-plugin.b ...

  3. 【pip uninstall 无法卸载】Not uninstalling numpy at /usr/lib/python2.7/dist-packages, outside environment /usr

    想卸载python的库numpy,执行pip uninstall gunicorn,报错如下: Not uninstalling numpy at /usr/lib/python2.7/dist-pa ...

  4. Python开发【模块】:Requests(二)

    Requests模块常见的4中post请求 HTTP 协议规定 POST 提交的数据必须放在消息主体(entity-body)中,但协议并没有规定数据必须使用什么编码方式.常见的四种编码方式如下: 1 ...

  5. HBase-0.95.1源码分析之split

    split操作执行的是将HBase中较大的Region分为两个.因为split比较耗时,因此split是在独立的线程中完成的,相关类是CompactSplitThread. 首先,CompactSpl ...

  6. 使用navicat mysql 远程连接数据库

    远程连接数据库,假设两台主机上都有navicat 客户端 远程主机A    ip地址:192.168.100.91  ,port  3306,数据库用户名 rootA   密码 123456A 本地主 ...

  7. 使用idea maven开发spring boot 分布式开发入门

    1:使用idea创建一个maven工程 bos2 2:删除bos2的src 文件夹,向pom.xml文件 中添加版本号 <packaging>pom</packaging> & ...

  8. 使用LinkedList模拟栈数据结构的集合

    封装MyStack类 public class MyStack { private LinkedList link; //调用MyStack创建对象的时候其实是调用的LinkedList创建的是Lin ...

  9. gcc static静态编译选项提示错误修正(/usr/lib/ld: cannot find -lc)

    用gcc静态编译C程序时显示出: /usr/lib/ld: cannot find -lc /usr/lib/ld: cannot find -lgcc_s /usr/lib/ld: cannot f ...

  10. 什么时候block 是放在全局区里面的?

    When a Block literal is written where there are global variables When the syntax in a Block literal ...