源地址:http://linux.chinaitlab.com/c/831529.html

一)fork的概述

  .操作系统对进程的管理,是通过进程表完成的.进程表中的每一个表项,记录的是当前操作系统中一个进程的信息.

  .进程在系统的唯一标识是PID,PID是一个从1到32768的正整数,其中1一般是特殊进程init,其它进程从2开始依次编号.当用完32768后,从2重新开始.

  .一个称为“程序计数器(program counter, pc)”的寄存器,指出当前占用 CPU的进程要执行的下一条指令的位置

  .当分给某个进程的 CPU时间已经用完,操作系统将该进程相关的寄存器的值,保存到该进程在进程表中对应的表项里面,把将要接替这个进程占用 CPU的那个进程的上下文,从进程表中读出,并更新相应的寄存器.

  二)fork的一个例子:

  #include <sys/types.h>

  #include <sys/types.h>

  #include <unistd.h>

  #include <stdio.h>

  int main()

  {

  pid_t pid;

  pid=fork();

  if(pid<0)

  printf("error in fork!");

  else if(pid==0)

  printf("I am the child process,ID is %d\n",getpid());

  else

  printf("I am the parent process,ID is %d\n",getpid());

  }

  gcc test1.c -o test1

  debian:/tmp# ./test1

  I am the child process,ID is 2723

  I am the parent process,ID is 2722

  程序分析:

  1)pid=fork();

  先来看看子进程的表现:

  操作系统调用fork()函数创建一个新的进程(子进程),并且在进程表中相应为它建立一个新的表项,

  此时子进程得到CPU的调度,它的上下文被换入,占据 CPU,操作系统对fork的实现,使得子进程中fork调用返回0

  所以在这个进程中pid=0,这个进程继续执行的过程中,if语句中 pid<0不满足,但是pid= =0是true。所以输出i am the child process...

  父进程的表现:

  操作系统对fork的实现,使这个调用在父进程中返回刚刚创建的子进程的pid(一个正整数),所以下面的if语句中pid<0,

  pid==0的两个分支都不会执行。所以输出i am the parent process...

  2)对子进程来说,fork返回给它0,但它的pid绝对不会是0,之所以fork返回0给它,是因为它随时可以调用getpid()来获取自己的pid

  3)fork之后父子进程除非采用了同步手段,否则不能确定谁先运行,也不能确定谁先结束.认为子进程结束后父进程才从fork返回的,这是不对的,fork不是这样的,vfork才这样。

  4)父进程执行了所有的进程,而子进程只执行了fork()后面的程序,这是因为子进程继承了父进程的PC(程序计数器).

  三)fork的另一个例子:

  #include <stdio.h>

  #include <sys/types.h>

  #include <unistd.h>

  int main()

  {

  pid_t pid1;

  pid_t pid2;

  pid1 = fork();

  pid2 = fork();

  printf("pid1:%d, pid2:%d\n", pid1, pid2);

  }

  gcc test2.c -o test2

  ./test2

  pid1:18938, pid2:0

  pid1:0, pid2:0

  pid1:18938, pid2:18939

  pid1:0, pid2:18940

  程序分析:

  1)执行test2时,启动一个进程,设这个进程为P0,PID为xxxxx

  2)当执行到pid1 = fork();时,P0启动了一个进程,设这个进程为P1,它的PID为18938,暂且不管P1.

  3)P0中的fork返回18938给pid1,继续执行到pid2 = fork();此时启动另一个新的进程,设为P2,P2的PID为18939 ,同样暂且不管P2.

  4)P0的第二个fork返回18939给p2,最后P0的执行结果为pid1:18938, pid2:18939

  5)再看P2,P2生成时,P0中的pid1=18938,所以P2中的pid1继承P0的pid1=18938,而作为子进程pid2=0,P2从第二个fork后开始执行,

  最后输出pid1:18938, pid2:0.

  6)回头看P1,P1中第一条fork返回0给pid1,然后接着执行后面的语句.而后面接着的语句是pid2 = fork();执行到这里,P1又产生了一个新进程,设为P3,先不管P3.

  7)P1中第二条fork将P3的PID返回给pid2,P3的PID为18940,所以P1的pid2=18940。P1继续执行后续程序,结束,输出“pid1:0, pid2:18940”.

  8)P3作为P1的子进程,继承P1中pid1=0,并且第二条fork将0返回给pid2,所以P3最后输出“pid1:0, pid2:0”.

  9)所有的进程都执行完毕.

  四)vfork与fork的区别

  vfork与fork主要有三点区别:

  .fork():子进程拷贝父进程的数据段,堆栈段

  vfork():子进程与父进程共享数据段

  .fork()父子进程的执行次序不确定vfork 保证子进程先运行,在调用 exec 或 exit 之前与父进程数据是共享的,在它调用 exec或 exit 之后父进程才可能被调度运行。

  .vfork()保证子进程先运行,在它调用 exec 或 exit 之后父进程才可能被调度运行.如果在调用这两个函数之前子进程依赖于父进程的进一步动作,则会导致死锁。

  1)先用fork()进行试验

  #include <unistd.h>

  #include <stdio.h>

  int main(void)

  {

  pid_t pid;

  int count=0;

  pid=fork();

  count++;

  printf("count= %d\n",count);

  return 0;

  }

 分析:

  通过上面fork()的说明,这个程序的输出应该是:

  ./test

  count= 1

  count= 1

  2)而将fork()换成vfork()呢,程序如下

  #include <unistd.h>

  #include <stdio.h>

  int main(void)

  {

  pid_t pid;

  int count=0;

  pid=vfork();

  count++;

  printf("count= %d\n",count);

  return 0;

  }

  执行结果:

  ./test

  count= 1

  count= 1

  Segmentation fault (core dumped)

  分析:

  通过将fork()换成vfork(),由于vfork()是共享数据段,为什么结果不是2呢,答案是:

  vfork保证子进程先运行,在它调用 exec 或 exit 之后父进程才可能被调度运行.如果在调用这两个函数之前子进程依赖于父进程的进一步动作,则会导致死锁.

  3)做最后的修改,在子进程执行时,调用_exit(),程序如下:

  #include <unistd.h>

  #include <stdio.h>

  #include <sys/types.h>

  int main(void)

  {

  pid_t pid;

  int count=0;

  pid=vfork();

  if(pid==0)

  {

  count++;

  _exit(0);

  }

  else

  {

  count++;

  }

  printf("count= %d\n",count);

  return 0;

  }

  执行结果:

  ./test

  count= 2

  分析:如果子进程中如果没有调用_exit(0),则父进程不可能被执行,在子进程调用exec(),exit()之后父进程才可能被调用.

  所以加上_exit(0),使子进程退出,父进程执行.

  这样 else 后的语句就会被父进程执行,又因在子进程调用 exec 或 exit 之前与父进程数据是共享的,

  所以子进程退出后把父进程的数据段 count 改成1了,子进程退出后,父进程又执行,最终就将count 变成了 2.

  五)写拷贝技术

  写拷贝或叫做写时拷贝,就是子进程在创建后共享父进程的虚存内存空间,只是在两个进程中某一个进程需要向虚拟内存写入数据时才拷贝相应部分的虚拟内存.

  写拷贝的目的是通过消除不必要的复制来提高效率,当运行一个fork进程时,两个进程将尽可能长地共享相同的物理内存,也就是说内核只复制页表入口地址和标记所有写拷贝的页面.

  当有一个进程修改内存时,将会引起缺页,这时内核将分配一个新的物理存储页,并在它被修改之前复制该页.

  这样对像init,xinetd,sshd这样的进程将非常有用,因为他们的工作也只是调用fork和exec.

  六)clone

  .clone函数是Linux所特有的,可以用于创建进程和线程,所有可移植代码从来不使用clone系统调用.

  .clone是一个复杂的系统调用,它给予应用程序很大的权限,可以控制父进程共享哪些子进程,它可以将一个线程当作一个特定进程,与其父进程共享用户共间.

  七)最后的总结:

  1)fork()系统调用是创建一个新进程的首选方式,fork的返回值要么是0,要么是非0,父进程与子进程的根本区别在于fork函数的返回值.

  2)vfork()系统调用除了能保证用户空间内存不会被复制之外,它与fork几乎是完全相同的.vfork存在的问题是它要求子进程立即调用exec,

  而不用修改任何内存,这在真正实现的时候要困难的多,尤其是考虑到exec调用有可能失败.

  3)vfork()的出现是为了解决当初fork()浪费用户空间内存的问题,因为在fork()后,很有可能去执行exec(),vfork()的思想就是取消这种复制.

  4)现在的所有unix变量都使用一种写拷贝的技术(copy on write),它使得一个普通的fork调用非常类似于vfork.因此vfork变得没有必要.

转:Linux fork与vfork的深入分析的更多相关文章

  1. linux fork函数与vfork函数,exit,_exit区别

    man vfork: NAME vfork - create a child process and block parent SYNOPSIS #include <sys/types.h> ...

  2. Linux下fork()、vfork()、clone()和exec()的区别

    转自Linux下fork().vfork().clone()和exec()的区别 前三个和最后一个是两个类型.前三个主要是Linux用来创建新的进程(线程)而设计的,exec()系列函数则是用来用指定 ...

  3. linux 进程创建clone、fork与vfork

    目录: 1.clone.fork与vfork介绍 2.fork说明 3.vfork说明 4.clone说明5.fork,vfork,clone的区别 内容: 1.clone.fork与vfork介绍 ...

  4. linux fork函数与vfork函数

    一.fork1. 调用方法#include <sys/types.h>#include <unistd.h> pid_t fork(void);正确返回:在父进程中返回子进程的 ...

  5. 1.2 Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

    fork和vfork分析: 在fork还没有实现copy on write之前,Unix设计者很关心fork之后立即执行exec所造成的地址空间浪费,也就是拷贝进程地址空间时的效率问题,所以引入vfo ...

  6. fork、vfork、clone区别

    在Linux中主要提供了fork.vfork.clone三个进程创建方法. 问题 在linux源码中这三个调用的执行过程是执行fork(),vfork(),clone()时,通过一个系统调用表映射到s ...

  7. 进程创建函数fork()、vfork() ,以及excel()函数

    一.进程的创建步骤以及创建函数的介绍 1.使用fork()或者vfork()函数创建新的进程 2.条用exec函数族修改创建的进程.使用fork()创建出来的进程是当前进程的完全复制,然而我们创建进程 ...

  8. fork与vfork详解

    一.fork函数 要创建一个进程,最基本的系统调用是fork,系统调用fork用于派生一个进程,函数原型如下: pid_t fork(void)  若成功,父进程中返回子进程ID,子进程中返回0,若出 ...

  9. fork()、vfork()、clone()和exec()

    前三个和最后一个是两个类型.前三个主要是Linux用来创建新的进程(线程)而设计的,exec()系列函数则是用来用指定的程序替换当前进程的所有内容.所以exec()系列函数经常在前三个函数使用之后调用 ...

随机推荐

  1. webstorm 初次上传代码到 远程gitlab中

    1. 在 公司搭建的gitlab网站,创建project,然后生成了 git的地址. 2.在 本地电脑上,打开 webstorm,要将已有的代码上传到 git网站,那么需要在webstrom编辑器的t ...

  2. error C2872: 'ULONG_PTR' : ambiguous symbol

    转自VC错误:http://www.vcerror.com/?p=74 问题描述: 错误:error C2872: 'ULONG_PTR' : ambiguous symbol 解决方法: 详细的解决 ...

  3. 为什么程序员都不喜欢使用switch,而是大量的 if……else if ?

    作者:熊爸爸 原文:http://3g.163.com/tech/article/E02RDE6C0511SDDL.html 请用5秒钟的时间查看下面的代码是否存在bug. OK,熟练的程序猿应该已经 ...

  4. range()函数在python3与python2中的区别

    range()函数在python3与python2中的区别 - CSDN博客 https://blog.csdn.net/weixin_37579123/article/details/8098038 ...

  5. dockerfile自动创建docker镜像

    特点:类似于ansible 剧本,大小几kb 而,手动做的镜像,要几百M,甚至上G ,传输不方便 dockerfile 支持自定义容器的初始命令 dockerfile只要组成部分: 基础镜像信息 FR ...

  6. C++命令行多文件编译(g++)

    在刚开始学Java时用命令行进行编译代码.而C++一直在用IDE, 这次尝试下命令行编译.vs下也可以用cl.exe.link.exe等命令来进行编译 但这次是通过安装MinGW来学习命令编译,主要用 ...

  7. atom的使用

    一,Atom介绍 Atom 是 Github 开源的文本编辑器,这个编辑器完全是使用Web技术构建的(基于Node-Webkit).启动速度快,提供很多常用功能的插件和主题,可以说Atom已经足以胜任 ...

  8. BZOJ1597: [Usaco2008 Mar]土地购买——斜率优化

    题目大意: 将$n$个长方形分成若干部分,每一部分的花费为部分中长方形的$max_长*max_宽$(不是$max_{长*宽}$),求最小花费 思路: 首先,可以被其他长方形包含的长方形可以删去 然后我 ...

  9. Java虚拟机性能管理神器 - VisualVM(8) 查找JAVA应用程序耗时的方法函数【转】

    Java虚拟机性能管理神器 - VisualVM(8) 查找JAVA应用程序耗时的方法函数[转] 标签: javajvm监控工具性能优化 2015-04-07 16:47 1846人阅读 评论(0)  ...

  10. 图论最短路径算法——SPFA

    为了不要让太多人被害,我还是说一下这种算法,它实际上很简单,但被人讲着讲着绕晕了. 主要思想 有人说,SPFA是Bellman-Ford的队列优化.这个算法我也懂了,但是还没试过.我不管是什么算法的优 ...