Linux0.11内核--内存管理之2.配合fork

在上一篇的fork函数中，首先一上来就调用get_free_page为新任务的数据结构申请一页内存，在memory.c中：

/*

* 获取首个(实际上是最后1 个:-)空闲页面，并标记为已使用。如果没有空闲页面，

* 就返回0。

*/

//// 取空闲页面。如果已经没有可用内存了，则返回0。

// 输入：%1(ax=0) - 0；%2(LOW_MEM)；%3(cx=PAGING PAGES)；%4(edi=mem_map+PAGING_PAGES-1)。

// 输出：返回%0(ax=页面起始地址)。

// 上面%4 寄存器实际指向mem_map[]内存字节图的最后一个字节。本函数从字节图末端开始向前扫描

// 所有页面标志（页面总数为PAGING_PAGES），若有页面空闲（其内存映像字节为0）则返回页面地址。

// 注意！本函数只是指出在主内存区的一页空闲页面，但并没有映射到某个进程的线性地址去。后面

// 的put_page()函数就是用来作映射的。

unsigned long

get_free_page (void)

{

  register unsigned long __res asm ("ax");

  __asm__ ("std ; repne ; scasb\n\t"	// 方向位置位，将al(0)与对应每个页面的(di)内容比较，

	   "jne 1f\n\t"											// 如果没有等于0 的字节，则跳转结束（返回0）。

	   "movb $1,1(%%edi)\n\t"					// 将对应页面的内存映像位置1。

	   "sall $12,%%ecx\n\t"						// 页面数*4K = 相对页面起始地址。

	   "addl %2,%%ecx\n\t"						// 再加上低端内存地址，即获得页面实际物理起始地址。

	   "movl %%ecx,%%edx\n\t"				// 将页面实际起始地址??edx 寄存器。

	   "movl $1024,%%ecx\n\t"				// 寄存器ecx 置计数值1024。

	   "leal 4092(%%edx),%%edi\n\t"		// 将4092+edx 的位置??edi(该页面的末端)。

	   "rep ; stosl\n\t"									// 将edi 所指内存清零（反方向，也即将该页面清零）。

	   "movl %%edx,%%eax\n"					// 将页面起始地址??eax（返回值）。

"1:": "=a" (__res): "" (0), "i" (LOW_MEM), "c" (PAGING_PAGES), "D" (mem_map + PAGING_PAGES - 1):"di", "cx",

	   "dx");

  return __res;										// 返回空闲页面地址（如果无空闲也则返回0）。

}

上面有几个指令比较陌生，先介绍repne scasb，其对应的等价指令是：

scans:inc edi

    dec ecx

    je loopdone

    cmp byte [edi-1],al

    jne scans

loopdone:

sall $12,%eax表示将%eax的值左移12位，相当于eax=eax*4096.

STOSL指令相当于将EAX中的值保存到ES:EDI指向的地址中。

所以第一句指令的意思是把al即%0的值0与di内容比较（倒序），edi为mem_map+PAGING_PAGES-1，即内存映射数组的最后一个可分页的下标内容，如果有等于0的字节表示还未使用，就将对应页面的内存映像位置1.

然后把ecx，此时不再是PAGING_PAGES，乘以4096得到相对页面的起始地址，再加上LOW_MEM得到页面实际物理起始地址。然后把这整页内存清0.最后返回这个页面的起始地址。

接下来看最关键的copy_page_tables函数：

// 刷新页变换高速缓冲宏函数。

// 为了提高地址转换的效率，CPU 将最近使用的页表数据存放在芯片中高速缓冲中。在修改过页表

// 信息之后，就需要刷新该缓冲区。这里使用重新加载页目录基址寄存器cr3 的方法来进行刷新。

// 下面eax = 0，是页目录的基址。

#define invalidate() \

__asm__( "movl %%eax,%%cr3":: "a" (0))

/*

* 好了，下面是内存管理mm 中最为复杂的程序之一。它通过只复制内存页面

* 来拷贝一定范围内线性地址中的内容。希望代码中没有错误，因为我不想

* 再调试这块代码了?。

*

* 注意！我们并不是仅复制任何内存块 - 内存块的地址需要是4Mb 的倍数（正好

* 一个页目录项对应的内存大小），因为这样处理可使函数很简单。不管怎样，

* 它仅被fork()使用（fork.c 第56 行）。

*

* 注意2！！当from==0 时，是在为第一次fork()调用复制内核空间。此时我们

* 不想复制整个页目录项对应的内存，因为这样做会导致内存严重的浪费 - 我们

* 只复制头160 个页面 - 对应640kB。即使是复制这些页面也已经超出我们的需求，

* 但这不会占用更多的内存 - 在低1Mb 内存范围内我们不执行写时复制操作，所以

* 这些页面可以与内核共享。因此这是nr=xxxx 的特殊情况（nr 在程序中指页面数）。

*/

//// 复制指定线性地址和长度（页表个数）内存对应的页目录项和页表，从而被复制的页目录和

//// 页表对应的原物理内存区被共享使用。

// 复制指定地址和长度的内存对应的页目录项和页表项。需申请页面来存放新页表，原内存区被共享；

// 此后两个进程将共享内存区，直到有一个进程执行写操作时，才分配新的内存页（写时复制机制）。

int

copy_page_tables (unsigned long from, unsigned long to, long size)

{

  unsigned long *from_page_table;

  unsigned long *to_page_table;

  unsigned long this_page;

  unsigned long *from_dir, *to_dir;

  unsigned long nr;

// 源地址和目的地址都需要是在4Mb 的内存边界地址上。否则出错，死机。

  if ((from & 0x3fffff) || (to & 0x3fffff))

    panic ("copy_page_tables called with wrong alignment");

// 取得源地址和目的地址的目录项(from_dir 和to_dir)。参见对115 句的注释。

  from_dir = (unsigned long *) ((from >> 20) & 0xffc);	/* _pg_dir = 0 */

  to_dir = (unsigned long *) ((to >> 20) & 0xffc);

// 计算要复制的内存块占用的页表数（也即目录项数）。

  size = ((unsigned) (size + 0x3fffff)) >> 22;

// 下面开始对每个占用的页表依次进行复制操作。

  for (; size-- > 0; from_dir++, to_dir++)

    {

// 如果目的目录项指定的页表已经存在(P=1)，则出错，死机。

      if (1 & *to_dir)

	panic ("copy_page_tables: already exist");

// 如果此源目录项未被使用，则不用复制对应页表，跳过。

      if (!(1 & *from_dir))

	continue;

// 取当前源目录项中页表的地址??from_page_table。

      from_page_table = (unsigned long *) (0xfffff000 & *from_dir);

// 为目的页表取一页空闲内存，如果返回是0 则说明没有申请到空闲内存页面。返回值=-1，退出。

      if (!(to_page_table = (unsigned long *) get_free_page ()))

	return -1;		/* Out of memory, see freeing */

// 设置目的目录项信息。7 是标志信息，表示(Usr, R/W, Present)。

      *to_dir = ((unsigned long) to_page_table) | 7;

// 针对当前处理的页表，设置需复制的页面数。如果是在内核空间，则仅需复制头160 页，否则需要

// 复制1 个页表中的所有1024 页面。

      nr = (from == 0) ? 0xA0 : 1024;

// 对于当前页表，开始复制指定数目nr 个内存页面。

      for (; nr-- > 0; from_page_table++, to_page_table++)

	{

	  this_page = *from_page_table;			// 取源页表项内容。

	  if (!(1 & this_page))								// 如果当前源页面没有使用，则不用复制。

	    continue;

// 复位页表项中R/W 标志(置0)。(如果U/S 位是0，则R/W 就没有作用。如果U/S 是1，而R/W 是0，

// 那么运行在用户层的代码就只能读页面。如果U/S 和R/W 都置位，则就有写的权限。)

	  this_page &= ~2;

	  *to_page_table = this_page;				// 将该页表项复制到目的页表中。

// 如果该页表项所指页面的地址在1M 以上，则需要设置内存页面映射数组mem_map[]，于是计算

// 页面号，并以它为索引在页面映射数组相应项中增加引用次数。而对于位于1MB 以下的页面，说明

// 是内核页面，因此不需要对mem_map[]进行设置。因为mem_map[]仅用于管理主内存区中的页面使用

// 情况。因此，对于内核移动到任务0 中并且调用fork()创建任务1 时（用于运行init()），由于此

//时

// 复制的页面还仍然都在内核代码区域，因此以下判断中的语句不会执行。只有当调用fork()的父进程

// 代码处于主内存区（页面位置大于1MB）时才会执行。这种情况需要在进程调用了execve()，装载并

// 执行了新程序代码时才会出现。

	  if (this_page > LOW_MEM)

	    {

// 下面这句的含义是令源页表项所指内存页也为只读。因为现在开始有两个进程共用内存区了。

// 若其中一个内存需要进行写操作，则可以通过页异常的写保护处理，为执行写操作的进程分配

// 一页新的空闲页面，也即进行写时复制的操作。

	      *from_page_table = this_page;		// 令源页表项也只读。

	      this_page -= LOW_MEM;

	      this_page >>= 12;

	      mem_map[this_page]++;

	    }

	}

    }

  invalidate ();		// 刷新页变换高速缓冲。

  return 0;

}

记得从fork传递过来的三个参数依次是old_data_base，new_data_base，data_limit。其中old_data_base是原进程局部描述符表中数据段的基地址（线性地址空间），new_data_base为新进程在线性地址空间中的基地址（任务号*64MB），data_limit为原进程的局部描述符表中数据段描述符中的段限长。

首先取源地址和目的地址的页目录项，因为一页内存为4K即4096，所以4096对应的是一个页表项，由于一个页表有1024个表项，所以一个页表为1024*4096=4194304，又由于一个完整的页表对应的是一个页目录项，所以页目录号即为地址除以4194304（即右移22位）。因为每项占4个字节，并且由于页目录是从物理地址0开始（head.s），因此实际的页目录项指针=页目录号*4（即左移2）。和0xffc（4092）相与表示不能超出1024个页目录项的范围。

紧接着计算限长的页目录项数，也即所占页表数，(size+4M)/4M。

然后用一个for循环依次复制每个占用的页表，首先取源目录项中的页表地址0xfffff000 & *from_dir，根据PDE的结构，12-31位为页表基地址，0-11位为各种属性。所以用0xfffff000清除低12位，获取高20位的页表基址。

接下来为目的页表申请一页空白内存，此页表的起始地址存在to_page_table中，并置前三位为1.再将这个地址值赋值给目的页目录项。

然后又用一个for循环复制以from_page_table为页表起始地址的一整个页表的页表项内容，首先取第一个源页表项的内容*from_page_table，其实就是某个页的地址和一些属性。然后将该页表项内容this_page赋值给*to_page_table。

后面一小段代码是设置只读。

最后一句为刷新页变换高速缓冲，没什么好说的。

上面的函数执行如果出错，则会调用free_page_tables来释放申请的内存：

/*

* 下面函数释放页表连续的内存块，'exit()'需要该函数。与copy_page_tables()

* 类似，该函数仅处理4Mb 的内存块。

*/

//// 根据指定的线性地址和限长（页表个数），释放对应内存页表所指定的内存块并置表项空闲。

// 页目录位于物理地址0 开始处，共1024 项，占4K 字节。每个目录项指定一个页表。

// 页表从物理地址0x1000 处开始（紧接着目录空间），每个页表有1024 项，也占4K 内存。

// 每个页表项对应一页物理内存（4K）。目录项和页表项的大小均为4 个字节。

// 参数：from - 起始基地址；size - 释放的长度。

int

free_page_tables (unsigned long from, unsigned long size)

{

  unsigned long *pg_table;

  unsigned long *dir, nr;

  if (from & 0x3fffff)									// 要释放内存块的地址需以4M 为边界。

																  //不能<4M，小于4M就等于本身，大于4M就等于0

    panic ("free_page_tables called with wrong alignment");

  if (!from)													// 出错，试图释放内核和缓冲所占空间。

    panic ("Trying to free up swapper memory space");

// 计算所占页目录项数(4M 的进位整数倍)，也即所占页表数。(size+4M)/4M

//一个页是4KB，一整个页表有1024个页，所以4KB*1024=4M就是一整个页表所对应的size容量

//然后一整个页表对应的是一个页目录项

  size = (size + 0x3fffff) >> 22;

// 下面一句计算起始目录项。对应的目录项号=from>>22，因每项占4 字节，并且由于页目录是从

// 物理地址0 开始，因此实际的目录项指针=目录项号<<2，也即(from>>20)。与上0xffc 确保

// 目录项指针范围有效。

  dir = (unsigned long *) ((from >> 20) & 0xffc);	/* _pg_dir = 0 */

  for (; size-- > 0; dir++)

    {																// size 现在是需要被释放内存的目录项数。

      if (!(1 & *dir))										// 如果该目录项无效(P 位=0)，则继续。

	continue;												// 目录项的位0(P 位)表示对应页表是否存在。

      pg_table = (unsigned long *) (0xfffff000 & *dir);	// 取目录项中页表地址。

      for (nr = 0; nr < 1024; nr++)

	{																// 每个页表有1024 个页项。

	  if (1 & *pg_table)								// 若该页表项有效(P 位=1)，则释放对应内存页。

	    free_page (0xfffff000 & *pg_table);

	  *pg_table = 0;										// 该页表项内容清零。

	  pg_table++;											// 指向页表中下一项。

	}

      free_page (0xfffff000 & *dir);			// 释放该页表所占内存页面。但由于页表在

																	// 物理地址1M 以内，所以这句什么都不做。

      *dir = 0;												// 对相应页表的目录项清零。

    }

  invalidate ();											// 刷新页变换高速缓冲。

  return 0;

}

这个函数和上面的函数类似，首先计算所占页目录项数，然后计算起始目录项地址。

然后用一个for循环先取到目录项中的页表地址，再用一个for循环把页表中的1024个页项清空，这里又用到一个函数free_page：

/*

* 释放物理地址'addr'开始的一页内存。用于函数'free_page_tables()'。

*/

//// 释放物理地址addr 开始的一页面内存。

// 1MB 以下的内存空间用于内核程序和缓冲，不作为分配页面的内存空间。

//a = i--;//先a = i ; 然后 i = i - 1;

void

free_page (unsigned long addr)

{

  if (addr < LOW_MEM)

    return;											// 如果物理地址addr 小于内存低端（1MB），则返回。

  if (addr >= HIGH_MEMORY)	// 如果物理地址addr>=内存最高端，则显示出错信息。

    panic ("trying to free nonexistent page");

  addr -= LOW_MEM;						// 物理地址减去低端内存位置，再除以4KB，得页面号。

  addr >>= 12;

  if (mem_map[addr]--)

    return;											// 如果对应内存页面映射字节不等于0，则减1 返回。

  mem_map[addr] = 0;					// 否则置对应页面映射字节为0，并显示出错信息，死机。

  panic ("trying to free free page");

}

这个函数是释放一页内存，首先得到页面号，然后把内存映射数组对应的下标的内容减1.比较简单。

所以free_page (0xfffff000 & *pg_table);的含义是先取页表项的内容，也就是对应的某一页内存的地址，然后释放这一页内存。

释放完这一页内存后，就把该页表项内容清零*pg_table=0.

接着再释放该页表所占的内存页面（4K），最后释放该页目录项的内容。

至此分析结束！

Linux0.11内核--内存管理之2.配合fork的更多相关文章

Linux-0.11内核源代码分析系列：内存管理get_free_page()函数分析
Linux-0.11内存管理模块是源码中比較难以理解的部分,如今把笔者个人的理解发表先发Linux-0.11内核内存管理get_free_page()函数分析有时间再写其它函数或者文件的:) /* ...
linux0.11内核源码剖析:第一篇内存管理、memory.c【转】
转自:http://www.cnblogs.com/v-July-v/archive/2011/01/06/1983695.html linux0.11内核源码剖析第一篇:memory.c July ...
linux内核--内核内存管理
如题目所示,为什么要称作“内核内存管理”,因为内核所需要的内存和用户态所需要的内存,这两者在管理上是不一样的. 这篇文章描述内核的内存管理,用户态的内存管理在以后的文章中讲述. 首先简单的说明一下下面 ...
Linux内核内存管理算法Buddy和Slab： /proc/meminfo、/proc/buddyinfo、/proc/slabinfo
slabtop cat /proc/slabinfo # name <active_objs> <num_objs> <objsize> <objpersla ...
Linux内核内存管理架构
内存管理子系统可能是linux内核中最为复杂的一个子系统,其支持的功能需求众多,如页面映射.页面分配.页面回收.页面交换.冷热页面.紧急页面.页面碎片管理.页面缓存.页面统计等,而且对性能也有很高的要 ...
windows内核内存管理
一.几个基本的概念 1.存储器的金字塔结构存储器从下之上依次是磁盘/flash.DRAM(内存).L2-cache.L1-cache.寄存器,越在上面的存储器访问速度越快,同时价格也越昂贵,每一级都 ...
Linux0.11内核剖析--内核体系结构
一个完整可用的操作系统主要由 4 部分组成:硬件.操作系统内核.操作系统服务和用户应用程序,如下图所示: 用户应用程序是指那些字处理程序. Internet 浏览器程序或用户自行编制的各种应用程序: ...

随机推荐

Textbox.Visible=False隐藏方式导致的问题
今天公司的正式环境有个功能不好使,但是测试环境没有问题,经过和同事的研讨,发现应该是我在写代码的时候把Textbox的visible属性设置为false导致的. 当时的需求是需要在发邮件的时候加上“相 ...
浅谈async、await关键字 => 深谈async、await关键字
前言之前写过有关异步的文章,对这方面一直比较弱,感觉还是不太理解,于是会花点时间去好好学习这一块,我们由浅入深,文中若有叙述不稳妥之处,还请批评指正. 话题 (1)是不是将方法用async关键字标识 ...
ES6 - Note5：Promise
1.Promise介绍 Promise最早是社区提出和实现,后面ES6将其写入标准,并原生提供Promise对象,是一种异步编程的解决方案,具体的概念大家可以去查看相关的资料.传统上处理异步都是以ca ...
EasyUI DataGrid formatter 格式化增加链接
function fLoadTable() { $('#tt').datagrid({ title: '', ...
追根溯源：EntityFramework 实体的状态变化
阅读目录: 1. 应用场景 2. 场景测试 3. 问题分析 4. 追根溯源 5. 简要总结 1. 应用场景首先,应用程序使用 EntityFramework,应用场景中有两个实体 S_Class(班 ...
小菜学习Winform（六）剪切板和拖放复制
前言在做winform项目的时候有时候会用到复制粘贴,在.net中提供了Clipboard类来操作剪切板,我们来看下. clipbrd.exe clipbrd是系统剪切板程序,但是在vista及以上 ...
在非SQL客户端使用命令行方式定期连接SQL Server 服务器并模拟用户查询操作，同时输出信息内容
一个很长的标题,实现的功能就是尽量使用非人力的方式模拟人去做一件事情,为了便于记录,将他们输出成文件方便查阅. 图形界面方式,使用微软自己的ConnMaker.exe,或者Microsoft 数据连接 ...
韩国"被申遗" （转自果壳）
"被申遗"不是指"没申遗",而是全都经过了中国人重新包装. 近日,有报道称韩国计划将火炕申报世界遗产,联系近年来韩国多起"申遗事件",国内网 ...
【jQuery小实例】js 插件查看图片
---本系列文章所用使用js均可在本博客文件中找到. 像淘宝一样,鼠标放在某一件商品上,展示大图信息,甚至查看图片的具体部位.给人超炫的效果,这种效果实现基于js文件和js插件.大致可以分为三步,添加 ...
EXP/IMP迁移案例，IMP遭遇导入表的表空间归属问题
生产环境: 源数据库:Windows Server + Oracle 11.2.0.1 目标数据库:SunOS + Oracle 11.2.0.3 1.确认迁移需求:源数据库cssf 用户所有表和数据 ...

Linux0.11内核--内存管理之2.配合fork

Linux0.11内核--内存管理之2.配合fork的更多相关文章

随机推荐

热门专题