之前已经做了一些理论上的铺垫,这次我们就可以看代码了。

一、代码清单

         ;代码清单11-1
;文件名:c11_mbr.asm
;文件说明:硬盘主引导扇区代码
;创建日期:2011-5-16 19:54 ;设置堆栈段和栈指针
mov ax,cs
mov ss,ax
mov sp,0x7c00 ;计算GDT所在的逻辑段地址
mov ax,[cs:gdt_base+0x7c00] ;低16位
mov dx,[cs:gdt_base+0x7c00+0x02] ;高16位
mov bx,16
div bx
mov ds,ax ;令DS指向该段以进行操作
mov bx,dx ;段内起始偏移地址 ;创建0#描述符,它是空描述符,这是处理器的要求
mov dword [bx+0x00],0x00
mov dword [bx+0x04],0x00 ;创建#1描述符,保护模式下的代码段描述符
mov dword [bx+0x08],0x7c0001ff
mov dword [bx+0x0c],0x00409800 ;创建#2描述符,保护模式下的数据段描述符(文本模式下的显示缓冲区)
mov dword [bx+0x10],0x8000ffff
mov dword [bx+0x14],0x0040920b ;创建#3描述符,保护模式下的堆栈段描述符
mov dword [bx+0x18],0x00007a00
mov dword [bx+0x1c],0x00409600 ;初始化描述符表寄存器GDTR
mov word [cs: gdt_size+0x7c00],31 ;描述符表的界限(总字节数减一) lgdt [cs: gdt_size+0x7c00] in al,0x92 ;南桥芯片内的端口
or al,0000_0010B
out 0x92,al ;打开A20 cli ;保护模式下中断机制尚未建立,应
;禁止中断
mov eax,cr0
or eax,1
mov cr0,eax ;设置PE位 ;以下进入保护模式... ...
jmp dword 0x0008:flush ;16位的描述符选择子:32位偏移
;清流水线并串行化处理器
[bits 32] flush:
mov cx,00000000000_10_000B ;加载数据段选择子(0x10)
mov ds,cx ;以下在屏幕上显示"Protect mode OK."
mov byte [0x00],'P'
mov byte [0x02],'r'
mov byte [0x04],'o'
mov byte [0x06],'t'
mov byte [0x08],'e'
mov byte [0x0a],'c'
mov byte [0x0c],'t'
mov byte [0x0e],' '
mov byte [0x10],'m'
mov byte [0x12],'o'
mov byte [0x14],'d'
mov byte [0x16],'e'
mov byte [0x18],' '
mov byte [0x1a],'O'
mov byte [0x1c],'K' ;以下用简单的示例来帮助阐述32位保护模式下的堆栈操作
mov cx,00000000000_11_000B ;加载堆栈段选择子
mov ss,cx
mov esp,0x7c00 mov ebp,esp ;保存堆栈指针
push byte '.' ;压入立即数(字节) sub ebp,4
cmp ebp,esp ;判断压入立即数时,ESP是否减4
jnz ghalt
pop eax
mov [0x1e],al ;显示句点 ghalt:
hlt ;已经禁止中断,将不会被唤醒 ;------------------------------------------------------------------------------- gdt_size dw 0
gdt_base dd 0x00007e00 ;GDT的物理地址 times 510-($-$$) db 0
db 0x55,0xaa

上面就是配书源码。我们一点一点看。

二、源码分析

(一)设置堆栈和栈指针

;设置堆栈段和栈指针
mov ax,cs
mov ss,ax
mov sp,0x7c00

这个没有什么好说的,就是初始化栈。这三行执行后,SS=0; SP=0x7c00;

需要注意的是,这样设置后,栈的区域从0x0000_7c00向下扩展(不含0x0000_7c00这个字节),该区域包含了很多BIOS数据,包括实模式下的中断向量表,所以一定要小心。

(二)安装段描述符

;计算GDT所在的逻辑段地址
mov ax,[cs:gdt_base+0x7c00] ;低16位
mov dx,[cs:gdt_base+0x7c00+0x02] ;高16位
mov bx,16
div bx
mov ds,ax ;令DS指向该段以进行操作
mov bx,dx ;段内起始偏移地址

怎么理解这段代码呢?

首先,在代码清单的95、96行,有

         gdt_size         dw 0
gdt_base dd 0x00007e00 ;GDT的物理地址

作者在这里声明了标号gdt_base,还初始化了一个双字——0x0000_7e00; 作者的意图是从这个地方开始建立全局描述符表GDT。我们的程序就是一个引导扇区,占用了512(=0x200)字节。程序加载的物理地址是0x7c00, 0x7c00+0x200 = 0x7e00. 可见,在物理地址的安排上,引导程序后面紧跟着就是GDT。

目前我们还是处在实模式下,所以要建立GDT,必须将GDT的线性地址(物理地址)转换成实模式下使用的“段地址:偏移地址”的形式。

mov ax,[cs:gdt_base+0x7c00] ;

这句使了段超越前缀“cs”,表明访问代码段中的数据;因为CS=0,所以就把物理地址(0x7c00+gdt_base)处的0x7e00传送给了ax; 同样地,将0x0000传送给dx; 为了把线性地址转换成逻辑地址,我们用DX:AX除以16,得到的商(AX)就是段地址,余数(DX)就是偏移地址。

mov bx,16       

        div bx           

        mov ds,ax                          ;令DS指向该段以进行操作

        mov bx,dx                          ;段内起始偏移地址

这几行执行之后,GDT的逻辑地址就是 DS:BX.

;创建0#描述符,它是空描述符,这是处理器的要求
mov dword [bx+0x00],0x00
mov dword [bx+0x04],0x00

处理器规定,GDT中的第一个描述符必须是空描述符。这是什么原因呢?因为很多时候,寄存器和内存单元的初始值都会为0,再加上程序设计有问题,就会在无意中用全0的索引来选择描述符,这当然是不好的。因此,处理器要求将第一个描述符定义成空描述符。所以,上面两行代码定义了一个空描述符。

;创建#1描述符,保护模式下的代码段描述符
mov dword [bx+0x08],0x7c0001ff
mov dword [bx+0x0c],0x00409800

这两行用来创建第二个描述符。之前的博文我们已经掌握了数据段和代码段描述符的格式,所以对这个描述符就不难理解了。

还记得我上一篇博文中写了一个小程序吗?http://blog.csdn.net/longintchar/article/details/50507218

赶紧用它来分析一下吧:

线性基地址:0x0000_7c00

段界限为0x001FF,因为G=0,所以该段的长度是512(2的9次方)字节;

特权级:0

其他字段就不逐个说明了,相信你一定能懂。很明显,这个描述符定义的段,就是主引导程序所在的区域。

接着看代码。

;创建#2描述符,保护模式下的数据段描述符(文本模式下的显示缓冲区)
mov dword [bx+0x10],0x8000ffff
mov dword [bx+0x14],0x0040920b

程序分析的结果是:

seg_base = 0XB8000

seg_limit = 0XFFFF

S = 1

DPL = 0

G = 0

D/B = 1

TYPE = 2

数据段: 可读可写

看来这个段是指向显存的。

;创建#3描述符,保护模式下的堆栈段描述符
mov dword [bx+0x18],0x00007a00
mov dword [bx+0x1c],0x00409600

这是创建栈段的描述符。程序分析的结果是:

-----------------------

seg_base = 0

seg_limit = 0X7A00

S = 1

DPL = 0

G = 0

D/B = 1

TYPE = 6

数据段: 向下扩展,可读可写

------------------------

正如作者所说:段界限的值0x7a00加上1(0x7a01),就是ESP寄存器所允许的最小值。当执行隐式的栈操作(如PUSH、CALL)时,处理器会检查ESP的值,一旦发现它小于0x7a01,就会引发异常中断。如果你还不理解,那么可以把书翻到215页。作者说在栈操作时,必须符合以下规则:

实际使用的段界限+1 <= (ESP的内容减操作数的长度) <= 0xFFFF_FFFF

就拿这个例子来说,因为G=0,所以段界限就是0x7a00. 假设现在ESP的内容是0x7a04,此时执行下面的指令:

push edx

因为压入的是双字,所以处理器会先将ESP的值减去4,于是ESP=0x7a00. 因为0x7a00小于0x7a01,因此会引发异常中断。

(三)LGDT指令

好了,现在描述符已经安装完毕,接下来的工作是加载描述符表的线性基地址和界限到GDTR寄存器。相关的指令是lgdt. 该指令的格式为:

lgdt m48

也就是说,该指令的操作数内存操作数。注意,该指令在实模式和保护模式下都可以执行,也不影响任何标志位。

这个内存操作数指向一个6字节的内存区域,要求低16位是GDT的界限值(表的总字节数减去1),高32位是GDT的线性基地址。

         gdt_size         dw 0
gdt_base dd 0x00007e00 ;GDT的物理地址

还记得吗,这是代码中事先定义了6字节的空间。前两个字节就是为了保存GDT的界限值。

;初始化描述符表寄存器GDTR
mov word [cs: gdt_size+0x7c00],31 ;描述符表的界限(总字节数减一) lgdt [cs: gdt_size+0x7c00]

第一句写入界限值,第二句把6字节加载到GDTR寄存器。

注意,到目前为止,我们依然在实模式下。

(四)关于A20

1.A20 GATE 起源[1]

在8086/8088中,只有20根地址线,所以可以访问的地址是2^20=1M。但由于8086/8088是16位地址模式,能够表示的地址范围是0-64K,所以为了访问1M内存,Intel采取了分段的模式。

即:物理地址=16位段地址*16 + 16位偏移

但这种方式引起了新的问题,通过上述分段模式,能够表示的最大内存为:FFFFh:FFFFh=FFFF0h+FFFFh=10FFEFh

但8086/8088只有20位地址线,所以当访问100000h~10FFEFh之间的内存时,系统并不认为访问越界而产生异常,而是自动从重新0开始计算,也就是说系统计算实际地址的时候是按照对1M求模的方式进行的,这种技术被称为wrap-around(回绕)。

到了80286,系统的地址总线发展为24根,这样能够访问的内存可以达到2^24=16M。为了兼容,Intel在设计80286时提出的目标是:在实模式下,系统所表现的行为应该和8086/8088所表现的完全一样。但最终,80286芯片却存在一个BUG:如果程序员访问100000H~10FFEFH之间的内存,系统将实际访问这块内存,而不是象过去一样重新从0开始。

为了解决上述问题,IBM使用键盘控制器上剩余的一些输出线来管理第21根地址线(从0开始数是第20根),被称为A20Gate;如果A20 Gate打开,则当程序员给出100000H~10FFEFH之间的地址的时候,系统将真正访问这块内存区域;如果A20Gate被禁止,则当程序员给出100000H~10FFEFH之间的地址的时候,系统仍然使用8086/8088的方式。绝大多数IBM PC兼容机默认的A20Gate是被禁止的。由于在当时没有更好的方法来解决这个问题,所以IBM使用了键盘控制器来操作A20 Gate,但是这种操作太麻烦了,要使用一大堆指令。

2.Alt_A20_GATE

Alt_A20_GATE ,又称Fast A20. 通过端口0x92的bit1来打开A20,具体方法是:先从端口读出原数据,接着将bit1置1,然后再写入该端口,这样就打开了A20.

正如代码所示

in al,0x92                         ;南桥芯片内的端口
or al,0000_0010B
out 0x92,al ;打开A20

一次学太多会不会觉得累呢?我们就说到这里,下次继续…

【参考资料】

[1] 如烟海的专栏. http://blog.csdn.net/ruyanhai/article/details/7181842

进入保护模式(一)——《x86汇编语言:从实模式到保护模式》读书笔记12的更多相关文章

  1. ASM:《X86汇编语言-从实模式到保护模式》第14章:保护模式下的特权保护和任务概述

    ★PART1:32位保护模式下任务的隔离和特权级保护  这一章是全书的重点之一,这一张必须要理解特权级(包括CPL,RPL和DPL的含义)是什么,调用门的使用,还有LDT和TSS的工作原理(15章着重 ...

  2. ASM:《X86汇编语言-从实模式到保护模式》第10章:32位x86处理器的编程架构

    ★PART1:32位的x86处理器执行方式和架构 1. 寄存器的拓展(IA-32) 从80386开始,处理器内的寄存器从16位拓展到32位,命名其实就是在前面加上e(Extend)就好了,8个通用寄存 ...

  3. ASM:《X86汇编语言-从实模式到保护模式》第11章:进入保护模式

    ★PART1:进入保护模式 1. 全局描述符表(Global Descriptor Table,GDT)        32位保护模式下,如果要使用一个段,必须先登记,登记的信息包括段的起始地址,段的 ...

  4. ASM:《X86汇编语言-从实模式到保护模式》第15章:任务切换

    15章其实应该是和14章相辅相成的(感觉应该是作者觉得14章内容太多了然后切出来了一点).任务切换和14章的某些概念是分不开的. ★PART1:任务门与任务切换的方法 1. 任务管理程序 14章的时候 ...

  5. ASM:《X86汇编语言-从实模式到保护模式》第8章:实模式下硬盘的访问,程序重定位和加载

        第八章是一个非常重要的章节,讲述的是实模式下对硬件的访问(这一节主要讲的是硬盘),还有用户程序重定位的问题.现在整理出来刚好能和保护模式下的用户程序定位作一个对比. ★PART1:用户程序的重 ...

  6. ASM:《X86汇编语言-从实模式到保护模式》第9章:实模式下中断机制和实时时钟

    中断是处理器一个非常重要的工作机制.第9章是讲中断在实模式下如何工作,第17章是讲中断在保护模式下如何工作. ★PART1:外部硬件中断 外部硬件中断是通过两个信号线引入处理器内部的,这两条线分别叫N ...

  7. ASM:《X86汇编语言-从实模式到保护模式》第16章:Intel处理器的分页机制和动态页面分配

    第16章讲的是分页机制和动态页面分配的问题,说实话这个一开始接触是会把人绕晕的,但是这个的确太重要了,有了分页机制内存管理就变得很简单,而且能直接实现平坦模式. ★PART1:Intel X86基础分 ...

  8. ASM:《X86汇编语言-从实模式到保护模式》1-4章:处理器,内存和硬盘基础

    其实很久之前就学完了实模式了,但是一直没有总结,感觉现在直接在书上做笔记的弊端就是有些知识点不能很很深刻地记下来(毕竟手写最明显的优点就是能深刻地记住知识,但是就是用太多的时间罢了).一下内容都是一些 ...

  9. ASM:《X86汇编语言-从实模式到保护模式》第17章:保护模式下中断和异常的处理与抢占式多任务

    ★PART1:中断和异常概述 1. 中断(Interrupt) 中断包括硬件中断和软中断.硬件中断是由外围设备发出的中断信号引发的,以请求处理器提供服务.当I/O接口发出中断请求的时候,会被像8259 ...

随机推荐

  1. 国外物联网平台(4):Ayla Networks

    国外物联网平台(4)——Ayla Networks 马智 定位 Ayla企业软件解决方案为全球部署互联产品提供强大的工具 功能 Ayla的IoT平台包含3个主要组成部分: (1) Ayla嵌入式代理A ...

  2. C#存取数据库图片

    form1 using System; using System.Collections.Generic; using System.ComponentModel; using System.Data ...

  3. 【SQL】- 基础知识梳理(五) - 触发器

    触发器的概念 触发器对表进行插入.更新.删除的时候会自动执行的特殊存储过程 触发器的语法 create trigger tgr_name on table_name with encrypion –加 ...

  4. C#多线程编程实战1.6线程优先级

    using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Threa ...

  5. Persistent and Transient Data Structures in Clojure

    此文已由作者张佃鹏授权网易云社区发布. 欢迎访问网易云社区,了解更多网易技术产品运营经验. 最近在项目中用到了Transient数据结构,使用该数据结构对程序执行效率会有一定的提高.刚刚接触Trans ...

  6. 十六、Node.js-fs模块-流

    10. fs.createReadStream 从文件流中读取数据 /** * 之前我们学习过读取文件内容的方法readFile():该方法适合读取文件内容比较少的文件,如果遇到数据量庞大的文件,我们 ...

  7. Python实现KNN算法

    Python实现Knn算法 关键词:KNN.K-近邻(KNN)算法.欧氏距离.曼哈顿距离  KNN是通过测量不同特征值之间的距离进行分类.它的的思路是:如果一个样本在特征空间中的k个最相似(即特征空间 ...

  8. 【智能算法】变邻域搜索算法(Variable Neighborhood Search,VNS)超详细解析和TSP代码实例以及01背包代码实例

    喜欢的话可以扫码关注我们的公众号哦,更多精彩尽在微信公众号[程序猿声] 00 目录 局部搜索再次科普 变邻域搜索 造轮子写代码 01 局部搜索科普三连 虽然之前做的很多篇启发式的算法都有跟大家提过局部 ...

  9. JavaScript 中this 初步理解笔记

    Javascript中函数中的this通常指向的是函数的拥有者,这个拥有者就是上下文执行对象:另外一点需要注意,this只能在javascript函数内部使用.

  10. bzoj1076 奖励关 期望dp

    题目传送门 题目大意:总共有k次弹出宝物的机会,宝物共有n种,弹出不同的宝物的概率相同的,是每个宝物都有价值,和选择这个宝物的限制(必须具有特定的宝物),问最后的最优期望是多少. 思路:“正向推概率, ...