使用 GCC 和 GNU Binutils 编写能在 x86 实模式运行的 16 位代码
不可否认,这次的标题有点长。之所以把标题写得这么详细,主要是为了搜索引擎能够准确地把确实需要了解 GCC 生成 16 位实模式代码方法的朋友带到我的博客。先说一下背景,编写能在 x86 实模式下运行的 16 位代码,这个话题确实有点复古,所以能找到的资料也相应较少。要运行 x86 实模式的程序,目前我知道的只有两种方式,一种是使用 DOS 系统,另一种是把它写成引导扇区的代码,在系统启动时直接运行。很显然,许多讲自己实现操作系统的书籍都会讲到 x86 实模式,也只有自己实现操作系统引导的朋友需要用到 x86 实模式,所以我这篇文章的阅读用户数肯定很少,虽然我自认为它填补了网上关于该话题相关资料缺乏的空白。因此,凡是逛到我这篇文章的朋友,请点一下推荐,谢谢。
为什么说我这篇博客填补了相关话题的空白呢?那是因为不管是那些写书的,还是网上写文章的,一旦需要编写 16 位的实模式代码,都喜欢拿 NASM 说事儿,一点也不顾 GNU AS 的感受。当然,这是有历史原因的,因为 Linux 自从其诞生起就是 32 位,就是多用户多任务操作系统,所以 GCC 和 Gnu AS 一移植到 Linux 上就是用来编写 32 位保护模式的代码的。而且,ELF 可执行文件格式也只有 ELF32 和 ELF64,没听说过有 ELF16 的。即使是 Linux 自己,刚诞生的时候(1991年),也只有使用 as86 汇编器来编写自己的 16 位启动代码,直到 1995 年以后,GNU AS 才逐步加入编写 16 位代码的能力。
下面开始我的 GCC 和 GNU Binutils 的 16 位代码之旅。我决定使用 DOS 作为我的测试环境,所以最后生成的可执行文件都把它制作成 DOS 系统中可运行的 Plain Binary 格式。第一步安装一个 qemu 虚拟机来运行 FreeDOS,安装虚拟机在 Ubuntu 中只需要一个 sudo apt-get install qemu 命令就可以完成,所以我就不截图了。但是 FreeDOS 的软盘映像文件需要到 Qemu 的官网上面去下载,下载地址如下图:
使用 qemu-system-i386 -fda freedos.img 可以运行 Qemu 虚拟机和 FreeDOS 系统,如下图:
因为汇编语言更接近底层,而 C 语言更高级,所以先从汇编语言开始,逐步过渡到 C 语言。先写一个简单的、能在 DOS 中显示一个“Hello,world!”的汇编语言程序,考虑到我之后会使用该程序调用 C 语言的 main 函数,并且该程序负责让程序运行结束后顺利返回 DOS 系统,所以我把这个程序命名为 test_code16_startup.s。其代码如下:
下面对以上代码进行简单解释:
1. GNU AS 汇编器使用的汇编语言采用的是 AT&T 语法,该语法和 Intel 语法不同。我更喜欢 AT&T 的语法,原因有两个,一是 AT&T 语法是 Linux 世界中通用的标准,二是 AT&T 语法在某些概念方面确实理解起来更简单(比如内存寻址模式)。有汇编语言基础的人,AT&T 语法学起来也很快,主要有以下几条:①汇编指令后面跟有操作数长度的后缀,比如 mov 指令,如果操作数是 8 位,则用 movb,如果操作数是 16 位,则用 movw,如果操作数是 32 位,则用 movl,如果操作数是 64 位,则用 movq,其余指令依此类推;②操作数的顺序是源操作数在前,目标操作数在后,比如 movw %cs, %ax 表示把 cs 寄存器中的数据移动到 ax 寄存器中,这个顺序和 Intel 汇编语法正好相反;③所有的寄存器使用 % 前缀,如 %ax, %di, %esp 等;④对于立即数,需要使用 $ 前缀,比如 $4, $0x0c,而且如果一个数字是以 0 开头,则是 8 进制,以其它数字开头,是 10 进制,以 0x 开头则是 16 进制,标号当立即数使用时,需要 $ 前缀,比如上面的 pushw $message,而标号当函数名使用时,不需要 $ 前缀,比如上面的 callw display_str;⑤内存寻址方式,众所周知,x86 寻址方式众多,什么直接寻址、间接寻址、基址寻址、基址变址寻址等等让人眼花缭乱,而 AT&T 语法对内存寻址方式做了一个很好的统一,其格式为 section:displacement(base, index, scale),其中 section 是段地址,displacement 是位移,base 是基址寄存器,index 是索引,scale 是缩放因子,其计算方式为线性地址=section + displacement + base + index*scale,最重要的是,可以省略以上格式中的一个或多个部分,比如 movw 4, %ax 就是把内存地址 4 中的值移动到 ax 寄存器中,movw 4(%esp), %ax 就是把 esp+4 指向的地址中的值移动到 ax 寄存器中,依此类推。我上面的介绍是不是全网络最简明的 AT&T 汇编语法教程?
2. 在以上代码中我全部使用的都是 16 位的指令,如 movw、pushw、callw 等,并且直接在代码中定义了字符串“Hello, world!”。
3. 在以上代码中使用了函数 display_str,在调用 display_str 之前,我使用 pushw $15 和 pushw $message 将参数从右向左依次压栈,然后使用 callw 指令调用函数,这和 C 语言的函数调用约定是一样的。调用 callw 指令会自动将 %ip 寄存器压栈,而在函数开始时,我又用 pushw %bp 将 %bp 寄存器压栈,所以 %esp 又向下移动了 4 个字节,所以在函数中使用 0x4(%esp) 和 0x6(%esp) 可以访问到这两个参数。在 32 位代码中,由于调用函数时压栈的是 %eip 和 %ebp,所以需要使用 0x8(%esp) 和 0xc(%esp) 来依次访问压栈的参数。关于汇编语言函数调用的细节,我这里有一本好书Linux汇编编程指南.pdf。这是一本免费的英文版电子书,其原名为《Programming from the ground up》。
4. 以上代码使用 BIOS 中断 int 0x10 来输出字符串,使用 DOS 中断 int 0x21 来返回 DOS 系统。
5. 最重要的是,需要使用 .code16 指令让汇编器将程序汇编成 16 位的代码。
代码完成后,使用下面一串命令就可以把它进行汇编、链接,然后转换成 DOS 下的纯二进制格式(Plain Binary),最后复制到 FreeDOS.img 中,使用 Qemu 虚拟机执行 FreeDOS,然后运行该 16 位实模式程序。这一串命令及其运行效果如下图:
这些命令中比较重要的选项我都特意标出来了。由于我用的是 64 位的环境,所以调用 as 命令的时候需要指定 --32 选项,调用 ld 命令的时候需要指定 -m elf_i386 选项。指定以上选项后,生成的是 32 位的 ELF 目标文件,否则默认会生成 64 位的 ELF 目标文件,如果目标文件是 64 位,以后和 C 语言生成的目标文件连接时会出问题。使用 32 位环境的朋友们不用特意指定这两个选项。由于 DOS 系统总是把 Plain Binary 文件载入到 0x100 地址处执行,所以调用 ld 命令时,需要指定 -Ttext 0x100 选项。ld 命令执行完成后,生成的是 ELF 格式的可执行文件 test.elf,最后需要调用 objcopy 生成纯二进制文件,-j .text 选项的意思是只需要代码段,因为我把“Hello, world!”也是定义在代码段中的,-O binary 选项指定输出格式为纯二进制文件,输出文件为 test.com。最后,将 freedos.img 镜像文件 mount 到 Ubuntu 中,将 test.com 拷贝到其中,然后 umount,然后运行虚拟机,在 DOS 中运行 test,就可以看到效果了。
除了 as 和 ld,GNU Binutils 中的其它程序也是写程序和分析程序时的好帮手。可以使用 readelf -S 查看 test.elf 文件中的所有段,也可以使用 objdump -s 命令将 test.elf 中的数据以 16 进制形式输入,如下图:
当然,也可以使用 objdump -d 或者 objdump -D 将程序进行反汇编,查看是否真正生成了 16 位代码,如下图:(反汇编时一定要指定 -m i8086 选项)
也可以对纯二进制格式的文件进行反汇编,必须指定 -b binary 选项,如下图,对 test.com 进行反汇编:
反汇编时,一定要指定 -m i8086 选项,否则 objdump 不知道反汇编的是 16 位代码。(前面提到过 Linux 从诞生起就是 32 位,所以 ELF 只有 32 位和 64 位两种,没有 16 位的ELF格式。)如下图,如果使用 -m i386 选项进行反汇编,反汇编结果将不知所云:
下面进入 C 语言的世界。为了搞清楚 C 语言生成的 16 位代码的汇编指令有哪些特别之处,先写一个简单的 C 语言程序进行调研,如下图:
该程序有以下特点:
1. 程序的开头使用了 __asm__(".code16\n") 嵌入汇编指令,以指示 as 生成 16 位代码;
2. display_str 函数的签名和之前汇编语言中的相同,可以使用它来观察 C 语言生成的代码如何传递参数。
使用下面的命令对程序进行编译和反汇编,如下图:
从上图可以看出,C 语言生成的代码虽然是 16 位,但是它有如下特点:①从生成的 display_str 函数中可以看出,函数一开始是 push %ebp,而不是 push %bp;②在 display_str 函数中获取参数的位置分别为 0x8(%ebp) 和 0xc(%ebp),而不是我在汇编语言中写的 0x4(%ebp) 和 0x6(%ebp);③从生成的 main 函数可以看出,调用 diaplay_str 之前,没有使用 push 命令把参数压栈,而是直接通过 sub $0x18, %esp 调整 %esp 的位置,然后使用 mov 指令将参数放到指定位置,和使用 push 指令的效果相同;④虽然我在 display_str 函数的定义中故意将长度参数定义为 short,但是从生成的代码中可以看到依然是每隔 4 个字节放一个参数。
另外需要说明的是,调用 gcc 时除了指定 -c 选项指示它只编译不连接外,还要指定 -m32 选项,这样才会生成 32 位的汇编代码,而只有在 32 位的汇编代码中使用 .code16 指令,才能编译成 16 位的机器码。如果没有指定 -m32 选项,则生成的是 64 位汇编代码,然后汇编时会出错。使用 -m32 选项后,生成的目标文件是 ELF32 格式。ELF32 格式的目标文件只能和 ELF32 格式的目标文件连接,这也是为什么前面的 as 和 ld 需要指定 --32 和 -m elf_i386 选项的原因。
通过以上分析,似乎可以得出以下结论:只需要将汇编代码中的 pushw %bp 更改为 pushl %ebp,然后将获取参数的位置调整为 0x8(%ebp) 和 0xc(%ebp),就可以从 C 语言里面成功调用到汇编语言中的函数了。而事实上,还有一点点小差距。从上面的反汇编代码中可以看到,函数调用时使用的是 16 位的 call 指令,该指令压栈的是 %ip,而不是 %eip,而 C 语言生成的函数框架中获取的参数位置是按照将 %eip 压栈计算出来的,它们之间差了两个字节。
为了证明我以上判断的准确性,我将上面的C语言程序和汇编程序修改后,编译连接成一个完整的程序,看看它究竟能否正确运行。如下图:
C语言程序修改很简单,就是去掉了 display_str 函数的实现,只保留声明。汇编代码如下图:
汇编语言的更改包含以下几个地方:将 display_str 函数导出,将 pushw %bp 改为 pushl %ebp,同时修改获取参数的位置。编译、连接、运行程序的指令如下:
可以看到“Hello world from C language”没有正确显示出来。上面的命令都是前面用过的,不需要多解释,唯一不同的是使用 C 语言写的程序多了一个 .rodata 段,所以在 objcopy 的时候需要把这个段也包含进来。
由于 C 语言生成的函数框架都是从 0x8(%ebp) 开始取参数,它认为 0x0(%ebp) 是 old ebp,0x4(%ebp)是 %eip,而事实上使用 16 位的 call 指令调用函数后,0x4(%ebp) 中是 %ip 而不是 %eip,所以要从 0x6(%ebp) 开始取参数。我们不可能修改 C 语言生成的函数框架,只能看看能否将 16 位的 call 改成 32 位的 call。
办法当然是有的,那就是不使用 .code16,而使用 .code16gcc。.code16gcc 和 .code16 不同的地方就在于它生成的汇编代码在使用到 call、ret、jump 等指令时,都生成 32 位的机器码,相当于 calll,retl,jumpl。这也是 .code16gcc 叫 .code16gcc 的原因,因为它就是配合 GCC 生成的函数框架使用的。
下面再来修改代码,C 语言代码修改很简单,只需要将 .code16 改成 .code16gcc 即可,如下图:
通过反汇编,可以看到它使用了 32 位的 calll 和 retl,如下图:
汇编程序的修改主要是将 .code16 改为 .code16gcc,然后手动将 callw 改成 calll,将 retw 改成 retl,如下图:
最后,编译连接,拷贝到 freedos.img,运行虚拟机,查看运行效果,如下图:
大功告成,运行效果如上图。
总结:
编写运行于 x86 实模式下的 16 位代码是一个很复古的话题,编写能在 DOS 下运行的 Plain Binary 可执行文件是一个更复古的话题。以往,凡是需要使用 x86 的 16 位实模式的时候,作者都喜欢用 NASM 来编程。比如《30天自制操作系统》、《Orange's 一个操作系统的实现》、《x86汇编语言——从实模式到保护模式》等书籍都以 NASM 汇编器和 Intel 汇编语法作为示例。而且他们都是在进入 32 位保护模式后,才让汇编语言和 C 语言共同工作。
我用 Linux 操作系统,所以我就是想不管是写 32 位代码,还是 16 位代码,都能使用 GCC 和 GNU AS。我还想即使是在 16 位模式下,也能尽量少用汇编语言,多用 C 语言。经过努力,有了上面的文章。使用 GCC 和 GNU Binutils 编写运行于 x86 实模式的 16 位代码的过程如下:
1. 如果只用汇编语言编写 16 位程序,请使用 .code16 指令,并保证只使用 16 位的指令和寄存器;如果要和 C 语言一起工作,请使用 .code16gcc 指令,并且在函数框架中使用 pushl,calll,retl,leavel,jmpl,使用 0x8(%ebp) 开始访问函数的参数;很显然,使用 C 语言和汇编语言混编的程序可以在实模式下运行,但是不能在 286 之前的真实 CPU 上运行,因为 286 之前的 CPU 还没有 pushl、calll、retl、leavel、jmpl 等指令。
2. 使用 as 时,请指定 --32 选项,使用 gcc 时,请指定 -m32 选项,使用 ld 时,请指定 -m elf_i386 选项。如果是反汇编 16 位代码,在使用 objdump 时,请使用 -m i8086 选项。
3. 在 DOS 中运行的 .com 文件会被加载到 0x100 处执行,所以使用 ld 连接时需指定 -Ttext 0x100 选项;引导扇区的代码会被加载到 0x7c00 处执行,所以使用 ld 连接时需指定 -Ttext 0x7c00 选项。
4. 使用 gcc、as、ld 生成的程序默认都是 ELF 格式,而在 DOS 下运行的 .com 程序是 Plain Binary 的,在引导扇区运行的代码也是 Plain Binary 的,所以需要使用 objcopy 将 ELF 文件中的代码段和数据段拷贝到一个 Plain Binary 文件中,使用 -O binary 选项; Plain Binary 文件也可以反汇编,在使用 objdump 时需指定 -b binary 选项。
(京山游侠于2014-08-24发布于博客园,转载请注明出处。)
使用 GCC 和 GNU Binutils 编写能在 x86 实模式运行的 16 位代码的更多相关文章
- Linux 桌面玩家指南:08. 使用 GCC 和 GNU Binutils 编写能在 x86 实模式运行的 16 位代码
特别说明:要在我的随笔后写评论的小伙伴们请注意了,我的博客开启了 MathJax 数学公式支持,MathJax 使用$标记数学公式的开始和结束.如果某条评论中出现了两个$,MathJax 会将两个$之 ...
- GNU Binutils工具
参考<程序员的自我修养---连接.装载与库> 以下内容转贴自 http://www.cnblogs.com/xuxm2007/archive/2013/02/21/2920890.html ...
- GNU Binutils简介及基本用法
[时间:2017-06] [状态:Open] [关键词:GNU, binutils, as, ld, ar, 基础工具,linux,链接器,汇编器] 0 简介 GNU Binary Utilities ...
- gcc, g++ - GNU 工程的 C 和 C++ 编译器 (egcs-1.1.2)
总览 (SYNOPSIS) gcc [ option | filename ]... g++ [ option | filename ]... 警告 (WARNING) 本手册页 内容 摘自 GNU ...
- 你知道 GNU Binutils 吗?【binutils】
概述 从事 Linux 开发的朋友们都不可避免地用到一些工具,比如 objcopy.nm.objdump.readelf 等等.其实这一系列的工具,就是所谓的 Binutils,当然 GNU 就表示它 ...
- centos LNMP第一部分环境搭建 LAMP LNMP安装先后顺序 php安装 安装nginx 编写nginx启动脚本 懒汉模式 mv /usr/php/{p.conf.default,p.conf} php运行方式SAPI介绍 第二十三节课
centos LNMP第一部分环境搭建 LAMP安装先后顺序 LNMP安装先后顺序 php安装 安装nginx 编写nginx启动脚本 懒汉模式 mv /usr/local/php/{ ...
- 16位cpu下主引导扇区及用户程序的编写
一些约定 主引导扇区代码(0面0道1扇区)加载至0x07c00处 用户程序头部代码需包含以下信息:程序总长度.程序入口.重定位表等信息 用户程序 当虚拟机启动时,在屏幕上显示以下两句话: This i ...
- (转载)用VS2012或VS2013在win7下编写的程序在XP下运行就出现“不是有效的win32应用程序“
原文地址:http://www.vcerror.com/?p=1483 问题描述: 用VC2013编译了一个程序,在Windows 8.Windows 7(64位.32位)下都能正常运行.但在Win ...
- 如何让VS2012编写的程序在XP下运行
Win32主程序需要以下设置 第一步:在工程属性General设置 第二步:在C/C++ Code Generation 设置 第三步:SubSystem 和 Minimum Required Ve ...
随机推荐
- (系统架构)标准Web系统的架构分层
标准Web系统的架构分层 1.架构体系分层图 在上图中我们描述了Web系统架构中的组成部分.并且给出了每一层常用的技术组件/服务实现.需要注意以下几点: 系统架构是灵活的,根据需求的不同,不一定每一层 ...
- kafka学习笔记:知识点整理
一.为什么需要消息系统 1.解耦: 允许你独立的扩展或修改两边的处理过程,只要确保它们遵守同样的接口约束. 2.冗余: 消息队列把数据进行持久化直到它们已经被完全处理,通过这一方式规避了数据丢失风险. ...
- LeetCode[5] 最长的回文子串
题目描述 Given a string S, find the longest palindromic substring in S. You may assume that the maximum ...
- WebForm获取GET或者POST参数到实体的转换,ADO.NET数据集自动转换实体
最近在修改维护以前的webform项目(维护别人开发的.....)整个aspx没有用到任何的控件,这个我也比较喜欢不用控件所以在提交信息的时候需要自己手动的去Request.QueryString[] ...
- CSS垂直居中的11种实现方式
今天是邓呆呆球衣退役的日子,在这个颇具纪念意义的日子里我写下自己的第一篇博客,还望前辈们多多提携,多多指教! 接下来,就进入正文,来说说关于垂直居中的事.(以下这11种垂直居中的实现方式均为笔者在日常 ...
- 为IEnumerable<T>添加RemoveAll<IEnumerable<T>>扩展方法--高性能篇
最近写代码,遇到一个问题,微软基于List<T>自带的方法是public bool Remove(T item);,可是有时候我们可能会用到诸如RemoveAll<IEnumerab ...
- C# 生成验证码图片时消除锯齿
引言 基于生成图片实现了一个手机号转图片的需求. 内容也很简单,直接用手机号生成一个png图片.就是为了背景透明以便其他地方调用. 有无锯齿主要依靠一句代码:g.TextRenderingHint= ...
- js从数组中随机取出不同的元素
前言 上午处理个需求需要从一个总数组中随机取出不同的元素.共使用两个方法.第一种方法较常规,经测试有bug,数据量大以后随机几次返回的对象直接是function而不是object. 当然简单数据类型应 ...
- spring boot 实战:我们的第一款开源软件
在信息爆炸时代,如何避免持续性信息过剩,使自己变得专注而不是被纷繁的信息所累?每天会看到各种各样的新闻,各种新潮的技术层出不穷,如何筛选出自己所关心的? 各位看官会想,我们是来看开源软件的,你给我扯什 ...
- TFS 安装错误
错误 问题详细: HTTP 错误 500.19 - Internal Server Error 无法访问请求的页面,因为该页的相关配置数据无效. 详细错误信息 模块 Dynam ...