Linux内核源代码的学习过程转换完成细节

linux中的进程是个最主要的概念，进程从执行队列到開始执行有两个開始的地方，

一个就是switch_to宏中的标号1："1:/t"，//仅仅要不是新创建的进程，差点儿都是从上面的那个标号1開始的,而switch_to宏则是除了内核本身，全部的进程要
想执行都要经过的地方

另一个就是ret_form_fork

这样看来。尽管linux的进程体系以及进程调度很复杂，可是整体看来就是一个沙漏状。

对于系统中的每一个新进程它首次被运行的过程必定是：

sys_fork---->do_fork---->copy_process ---->copy_thread 当中copy_process 设置的新进程的eip ret_from_fork
--->放入就绪队列---->被调度---->运行switch_to

然后就到了jmp
__switch_to了，这是个函数。这个函数的返回地址就区分了被调度的进程是新创建的进程还是已经运行过的进程了。

新创建（没有被运行过）的进程的返回地址是ret_from_fork

已经运行过的进程的返回地址是：switch_to中的标号1：

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvYWdhbmxlbmd6aQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" alt="">

switch_to宏就是沙漏中间那个最细的地方，想从一端到还有一端。必定要经过那个地方，在非新创建的进程的情况下，全部进程都是从标号1開始，

看一下switch_to宏：

#define switch_to(prev,next,last) do {                            /

         unsigned long esi,edi;                                          /

         asm volatile("pushfl/n/t"                                      /

                      "pushl %%ebp/n/t"                                 /

                      "movl %%esp,%0/n/t"        /* save ESP */          /

                      "movl %5,%%esp/n/t"        /* restore ESP */       /   //注意这里已经切换到了新的内核栈，故原来的栈中的局部变量所有失效。因而想得到其值就必须想办法保存它们，为了效率。这里将prev保存在寄存器中，以便善后使用

                      "movl $1f,%1/n/t"          /* save EIP */          /   //这里。仅仅要是以前在这里被切换出去的进程都会将标号1作为再回来时的eip

                      "pushl %6/n/t"             /* restore EIP */       /   //将新进程的eip压入栈中，由于以下是个jmp，并且jmp到的函数最后有一个return。那么依照return的语义，就能够从栈取出eip加载 eip寄存器了，实际上这个对__switch_to的jmp调用就是一个手动的call调用(须要注意的是，这里return的是下一个进程的eip保存的是本进程的eip留给下次被切换进来的时候像如今这样使用)。非常巧妙

                      "jmp __switch_to/n"                                /   //__switch_to是个FASTCALL的函数。eax/ebx寄存器传參数

                      "1:/t"                                             /   //标号1的指令，非常easy。可是就是这个简单成全了总体架构的简单 这里为什么不用call

                      "popl %%ebp/n/t"                                   /

                      "popfl"                                            /

                      :"=m" (prev->thread.esp),"=m" (prev->thread.eip), /

                       "=a" (last),"=S" (esi),"=D" (edi)                 /

                      :"m" (next->thread.esp),"m" (next->thread.eip),    /

                       "2" (prev), "d" (next));                          /

} while (0)

switch_to宏里面的第三个參数是什么？

实际上这里的三个參数各自是原先A的 prev和next 而最后一个參数是 A被切换进来的前一个进程为什么要这第三个（被调度前的一个进程）參数呢？留待兴许

linux 之所以实现上述的单点切换就是为了减少复杂度，事实上非常多操作系统内核都是这么做的。这里的单点并非指switch_to这个单点，而是保存/恢复eip 这个寄存器从而保证全部切换回来的进程都从一个地方開始，可是有点美中不足的就是linux并没有将全部的进程从就绪到開始运行都从标号1開始。这也就引出了以下一个问题：

为什么不用call 取代 push+jmp？

假设用call 的话。call运行的时候首先将标号1处的地址压栈，然后jmp到__switch_to開始运行， __switch_to的函数都要返回到标号1：開始处来运行

而其实并非这种，由于新创建的进程并非从标号1開始运行的。而是从ret_from_fork開始运行的。

所以新进程在运行宏 switch_to到 "jmp
__switch_to/n"的时候，它的返回地址将不会是标号1:而应该是eip，即在copy_thread中设置的eip中的值：ret_from_fork

所以关键点是这里的__switch_to函数

全部进程被调度的时候应该运行的是：

新创建进程返回的地址是：ret_from_fork

已经被调度过的进程的返回地址是：1：

看看新创建进程的返回地址处干了什么

到这里说明。新的线程已产生了.

ENTRY(ret_from_fork)

    pushl %eax

    call schedule_tail

    GET_THREAD_INFO(%ebp)

    popl %eax

    jmp syscall_exit

syscall_exit:

...

work_resched:

    call schedule

...

当他从ret_from_fork退出时。会从堆栈中弹出原来保存的eip，而ip指向kernel_thread_helper,

至此kernel_thread_helper被调用。他就行执行我们的指定的函数了do_exit().

从内核空间返回到用户空间。

http://my.oschina.net/linuxred/blog/9477

这样费事做的原因是什么？

看看 do_fork的实现就知道，事实上新创建的进程是不这么做的，新创建的进程的eip是ret_from_fork而不是标号1，这个原因是什么？新创建进程的时候要手工指定一个開始的地址，毕竟它要開始就要有个起点，那么起点在哪里好呢？

最好是模拟该进程和别的已有进程一样是又一次開始执行的，这样比較统一又便于管理，然后将这个開始地址也指为标号1。可是这时标号1在哪里，是标号1在嵌入式汇编宏中导致标号1的地址不好取到吗，假设真的由于这的话，全然能够将标号1分
离出来放到一个地方，然后无论是已经有的进程还是新创建的进程都从这个固定的分离出来标号1的地址处取指令不就能够了吗？内核的设计者不可能还没有我聪明，那样的话会浪费取指令的时间和空间的，

来个间接引用肯定没有嵌入式汇编标号直接。减少时间开销，并且另一个原因。用ret_from_fork全然能够做到和既有进程的标号1一样的好。

我们看看进程切换函数的设计。既有进程的切换都是在schedule里面进入switch_to从而找到标号1的，而在 switch_to之后就剩下一个finish_task_switch和推断又一次调度标志了。

我们看看ret_from_fork：

ENTRY(ret_from_fork)

pushl %eax //注意刚从switch_to调用的__switch_to中ret回来。正好ret到了ret_from_fork（注意switch_to中jmp 指令前的push），而那个函数返回的就是prev，将其放到了eax中，故这里schedule_tail的參数就是prev，也就是切换出去的进程。

call schedule_tail

         GET_THREAD_INFO(%ebp)

         popl %eax

         jmp syscall_exit

上面看到ret_from_fork调用的schedule_tail參数是切换出去的进程，而后者立即调用finish_task_switch，这样就和schedule中的switch_to之后的逻辑对上了，并且參数也没有什么问题，

那么finish_task_switch之后的逻辑呢，比方推断又一次调度标志怎么办？

那就看看ret_from_fork中的syscall_exit吧，那里面做了推断，假设须要调度，那就会进入正常的 schedule流程，十分正确。

事实上就是这个finish_task_switch善后惹的祸。只是它的设计也是一个非常巧妙的看点，它主要推断原先的进程是否还有存在的必要，假设已经dead了，那么就是在这里彻底释放其task_struct的，因此必须保存prev的值（回答了为甚么要三个參数这个问题引出的“要了这第三个參数有什么问题”），由于prev是
schedule的局部变量在prev的内核栈中，在切换到新的内核栈后（schedule函数用到了两个内核栈），prev失效。因此才要保存（这里能够理解为从prev传递到兴许可见的地方）的。

http://blog.csdn.net/dog250/article/details/5303541

Linux内核源代码的学习过程转换完成细节的更多相关文章

Linux内核源代码分析方法
Linux内核源代码分析方法一.内核源代码之我见 Linux内核代码的庞大令不少人"望而生畏",也正由于如此,使得人们对Linux的了解仅处于泛泛的层次.假设想透析Linux ...
Linux内核源代码获取教程
Linux内核源代码获取方法什么叫Linux 什么叫Linux内核 Linux内核源代码的获取什么叫Linux? Linux是一套免费使用和自由传播的类Unix操作系统,是一个基于POSIX和UN ...
在windows下解压缩Linux内核源代码出现重复文件原因
在windows下解压缩Linux内核源代码出现重复文件原因 2009年06月30日 13:35 来源:ChinaUnix博客作者:embededgood 编辑:周荣茂原因一.因为在Lin ...
Linux内核源代码情景分析系列
http://blog.sina.com.cn/s/blog_6b94d5680101vfqv.html Linux内核源代码情景分析---第五章文件系统 5.1 概述构成一个操作系统最重要的就 ...
Linux内核源代码
说明:只供学习交流一,目录结构 Linux内核源代码采用树形结构进行组织,非常合理地把功能相关的文件都放在同一个子目录下,使得程序更具有可读性. 二,目录结构 arch目录 arch是archite ...
Linux内核源代码目录树结构
Linux内核源代码目录树结构. arch:包含和硬件体系结构相关的代码,每种平台占一个相应的目录.和32位PC相关的代码存放在i386目录下,其中比较重要的包括kernel(内核核心部分).mm(内 ...
《深入分析Linux内核源代码》读书、私藏笔记大放送
秉承着"不懂操作系统原理的程序员不是合格的程序员"的至理名言,鄙人又是买陈莉君老师的“Linux教学视频”,又是研读其力作<深入分析Linux内核源代码>,先将总结笔记 ...
Ubuntu：编译Linux内核源代码和内核模块
1. 目的内核模块需要运行在Linux 3.8.13内核中,因此需要为此内核重新编译内核模块源代码. 2. 步骤 1.在Ubuntu 14.04 64位(内核3.13.0-24-generic)上, ...
linux内核源代码、配置与编译
内核源代码下载:www.kernel.org Linux内核源代码采用树形结构进行组织,非常合理地把功能相关的文件都放在同一个子目录下,使得程序更具可读性. linux内核代码最好不要在windows ...

随机推荐

perl的一些基本用法
ReadLine support available (try 'install Bundle::CPAN')cpan>进入cpan的shell,好了,我为了安装spamassassin,需要安 ...
显示形状回归算法（ESR）代码介绍
源地址:http://www.thinkface.cn/thread-3704-1-6.html 人脸对齐包括两个部分,分别为训练部分和测试部分.所有的代码基于opencv2.0.(一)训练阶段Ste ...
Linux多线程服务端编程:使用muduo C++网络库
内容推荐本书主要讲述采用现代C++在x86-64 Linux上编写多线程TCP网络服务程序的主流常规技术,重点讲解一种适应性较强的多线程服务器的编程模型,即one loop per thread.这 ...
SharePoint 内容部署-PowerShell
1. 创建一个新的内容部署路径 New-SPContentDeploymentPath –Name "Marketing Internet Content" –SourceSPWe ...
IOS7最新的系统漏洞
苹果近期就实用户发现了一个新iOS7系统漏洞,利用这个漏洞绕过password输入界面,在不知道password的情况下打开你近期使用的软件. 而这个过程仅仅需短短的5秒钟! 经測试,这个漏洞并没那么 ...
redhat linux使用Centos yum源
redhat Linux如果是没有购买红帽许可的话是不能使用redhat的yum源的,但是可以通过修改使之能使用Centos的yum源. 步骤一:删除redhat的yum [root@localhos ...
给公司部门设计的SOA架构(转)
新来老大年前开会说:各位同学,公司业务越来越重,未来几年要成倍增长......,我们要梳理出一套新架构,才能更好的支持N万用户.....,以后升职加薪当上....打败..... 想想还有点小激动呢,于 ...
hdu5171（矩阵快速幂）
传送门:GTY's birthday gift 题意:GTY的朋友ZZF的生日要来了,GTY问他的基友送什么礼物比较好,他的一个基友说送一个可重集吧!于是GTY找到了一个可重集S,GTY能使用神犇魔法 ...
mongodb分页优化
现在参与一个项目的开发,需要用java查询mongodb数据库,在这里分页用的skip sort 和limit结合,查询语句如下(已经在相关字段建立索引) DBCursor cursor = coll ...
HTML学习笔记——各种居中对齐
0.前言水平居中基本方法--指定块的宽度并设定块的左右外边距为auto,上下外边距可取0,那么该块能够在父元素中水平居中. 样式例如以下: 1:margin:0px auto 2:margi ...

Linux内核源代码的学习过程转换完成细节

Linux内核源代码的学习过程转换完成细节的更多相关文章

随机推荐

热门专题