0x01 前言

  此文出自:https://www.cnblogs.com/Anker/p/3271773.html

  博文主要用unix/linux举例,但道理没问题的同样有助于在Python中理解僵尸进程和孤儿进程

0x02 基本概念

  我们知道在unix/linux中,正常情况下,子进程是通过父进程创建的,子进程在创建新的进程。子进程的结束和父进程的运行是一个异步过程,即父进程永远无法预测子进程 到底什么时候结束。

当一个 进程完成它的工作终止之后,它的父进程需要调用wait()或者waitpid()系统调用取得子进程的终止状态。

  1.   孤儿进程:一个父进程退出,而它的一个或多个子进程还在运行,那么那些子进程将成为孤儿进程。孤儿进程将被init进程(进程号为1)所收养,并由init进程对它们完成状态收集工作。
  2.  
  3.   僵尸进程:一个进程使用fork创建子进程,如果子进程退出,而父进程并没有调用waitwaitpid获取子进程的状态信息,那么子进程的进程描述符仍然保存在系统中。这种进程称之为僵死进程。

0x03 问题及危害

  unix提供了一种机制可以保证只要父进程想知道子进程结束时的状态信息, 就可以得到。这种机制就是: 在每个进程退出的时候,内核释放该进程所有的资源,包括打开的文件,占用的内存等。 但是仍然为其保留一定的信息(包括进程号the process ID,退出状态the termination status of the process,运行时间the amount of CPU time taken by the process等)。直到父进程通过wait / waitpid来取时才释放。 但这样就导致了问题,如果进程不调用wait / waitpid的话, 那么保留的那段信息就不会释放,其进程号就会一直被占用,但是系统所能使用的进程号是有限的,如果大量的产生僵死进程,将因为没有可用的进程号而导致系统不能产生新的进程. 此即为僵尸进程的危害,应当避免。

  孤儿进程是没有父进程的进程,孤儿进程这个重任就落到了init进程身上,init进程就好像是一个民政局,专门负责处理孤儿进程的善后工作。每当出现一个孤儿进程的时候,内核就把孤 儿进程的父进程设置为init,而init进程会循环地wait()它的已经退出的子进程。这样,当一个孤儿进程凄凉地结束了其生命周期的时候,init进程就会代表党和政府出面处理它的一切善后工作。因此孤儿进程并不会有什么危害。

  任何一个子进程(init除外)在exit()之后,并非马上就消失掉,而是留下一个称为僵尸进程(Zombie)的数据结构,等待父进程处理。这是每个 子进程在结束时都要经过的阶段。如果子进程在exit()之后,父进程没有来得及处理,这时用ps命令就能看到子进程的状态是“Z”。如果父进程能及时 处理,可能用ps命令就来不及看到子进程的僵尸状态,但这并不等于子进程不经过僵尸状态。  如果父进程在子进程结束之前退出,则子进程将由init接管。init将会以父进程的身份对僵尸状态的子进程进行处理。

  僵尸进程危害场景:

  例如有个进程,它定期的产 生一个子进程,这个子进程需要做的事情很少,做完它该做的事情之后就退出了,因此这个子进程的生命周期很短,但是,父进程只管生成新的子进程,至于子进程 退出之后的事情,则一概不闻不问,这样,系统运行上一段时间之后,系统中就会存在很多的僵死进程,倘若用ps命令查看的话,就会看到很多状态为Z的进程。 严格地来说,僵死进程并不是问题的根源,罪魁祸首是产生出大量僵死进程的那个父进程。因此,当我们寻求如何消灭系统中大量的僵死进程时,答案就是把产生大 量僵死进程的那个元凶枪毙掉(也就是通过kill发送SIGTERM或者SIGKILL信号啦)。枪毙了元凶进程之后,它产生的僵死进程就变成了孤儿进 程,这些孤儿进程会被init进程接管,init进程会wait()这些孤儿进程,释放它们占用的系统进程表中的资源,这样,这些已经僵死的孤儿进程 就能瞑目而去了。

0x04 孤儿进程和僵尸进程测试

孤儿进程测试程序如下所示:

  1. 1 #include <stdio.h>
  2. 2 #include <stdlib.h>
  3. 3 #include <errno.h>
  4. 4 #include <unistd.h>
  5. 5
  6. 6 int main()
  7. 7 {
  8. 8 pid_t pid;
  9. 9 //创建一个进程
  10. 10 pid = fork();
  11. 11 //创建失败
  12. 12 if (pid < 0)
  13. 13 {
  14. 14 perror("fork error:");
  15. 15 exit(1);
  16. 16 }
  17. 17 //子进程
  18. 18 if (pid == 0)
  19. 19 {
  20. 20 printf("I am the child process.\n");
  21. 21 //输出进程ID和父进程ID
  22. 22 printf("pid: %d\tppid:%d\n",getpid(),getppid());
  23. 23 printf("I will sleep five seconds.\n");
  24. 24 //睡眠5s,保证父进程先退出
  25. 25 sleep(5);
  26. 26 printf("pid: %d\tppid:%d\n",getpid(),getppid());
  27. 27 printf("child process is exited.\n");
  28. 28 }
  29. 29 //父进程
  30. 30 else
  31. 31 {
  32. 32 printf("I am father process.\n");
  33. 33 //父进程睡眠1s,保证子进程输出进程id
  34. 34 sleep(1);
  35. 35 printf("father process is exited.\n");
  36. 36 }
  37. 37 return 0;
  38. 38 }

测试结果如下:

僵尸进程测试程序如下所示:

  1. 1 #include <stdio.h>
  2. 2 #include <unistd.h>
  3. 3 #include <errno.h>
  4. 4 #include <stdlib.h>
  5. 5
  6. 6 int main()
  7. 7 {
  8. 8 pid_t pid;
  9. 9 pid = fork();
  10. 10 if (pid < 0)
  11. 11 {
  12. 12 perror("fork error:");
  13. 13 exit(1);
  14. 14 }
  15. 15 else if (pid == 0)
  16. 16 {
  17. 17 printf("I am child process.I am exiting.\n");
  18. 18 exit(0);
  19. 19 }
  20. 20 printf("I am father process.I will sleep two seconds\n");
  21. 21 //等待子进程先退出
  22. 22 sleep(2);
  23. 23 //输出进程信息
  24. 24 system("ps -o pid,ppid,state,tty,command");
  25. 25 printf("father process is exiting.\n");
  26. 26 return 0;
  27. 27 }

测试结果如下所示:

僵尸进程测试2:

父进程循环创建子进程,子进程退出,造成多个僵尸进程,程序如下所示:

  1. 1 #include <stdio.h>
  2. 2 #include <stdlib.h>
  3. 3 #include <unistd.h>
  4. 4 #include <errno.h>
  5. 5
  6. 6 int main()
  7. 7 {
  8. 8 pid_t pid;
  9. 9 //循环创建子进程
  10. 10 while(1)
  11. 11 {
  12. 12 pid = fork();
  13. 13 if (pid < 0)
  14. 14 {
  15. 15 perror("fork error:");
  16. 16 exit(1);
  17. 17 }
  18. 18 else if (pid == 0)
  19. 19 {
  20. 20 printf("I am a child process.\nI am exiting.\n");
  21. 21 //子进程退出,成为僵尸进程
  22. 22 exit(0);
  23. 23 }
  24. 24 else
  25. 25 {
  26. 26 //父进程休眠20s继续创建子进程
  27. 27 sleep(20);
  28. 28 continue;
  29. 29 }
  30. 30 }
  31. 31 return 0;
  32. 32 }

程序测试结果如下所示:

0x05 僵尸进程解决办法

(1)通过信号机制

子进程退出时向父进程发送SIGCHILD信号,父进程处理SIGCHILD信号。在信号处理函数中调用wait进行处理僵尸进程。测试程序如下所示:

  1. 1 #include <stdio.h>
  2. 2 #include <unistd.h>
  3. 3 #include <errno.h>
  4. 4 #include <stdlib.h>
  5. 5 #include <signal.h>
  6. 6
  7. 7 static void sig_child(int signo);
  8. 8
  9. 9 int main()
  10. 10 {
  11. 11 pid_t pid;
  12. 12 //创建捕捉子进程退出信号
  13. 13 signal(SIGCHLD,sig_child);
  14. 14 pid = fork();
  15. 15 if (pid < 0)
  16. 16 {
  17. 17 perror("fork error:");
  18. 18 exit(1);
  19. 19 }
  20. 20 else if (pid == 0)
  21. 21 {
  22. 22 printf("I am child process,pid id %d.I am exiting.\n",getpid());
  23. 23 exit(0);
  24. 24 }
  25. 25 printf("I am father process.I will sleep two seconds\n");
  26. 26 //等待子进程先退出
  27. 27 sleep(2);
  28. 28 //输出进程信息
  29. 29 system("ps -o pid,ppid,state,tty,command");
  30. 30 printf("father process is exiting.\n");
  31. 31 return 0;
  32. 32 }
  33. 33
  34. 34 static void sig_child(int signo)
  35. 35 {
  36. 36 pid_t pid;
  37. 37 int stat;
  38. 38 //处理僵尸进程
  39. 39 while ((pid = waitpid(-1, &stat, WNOHANG)) >0)
  40. 40 printf("child %d terminated.\n", pid);
  41. 41 }

测试结果如下所示:

(2)fork两次
  《Unix 环境高级编程》8.6节说的非常详细。原理是将子进程成为孤儿进程,从而其的父进程变为init进程,通过init进程可以处理僵尸进程。测试程序如下所示:

  1. 1 #include <stdio.h>
  2. 2 #include <stdlib.h>
  3. 3 #include <unistd.h>
  4. 4 #include <errno.h>
  5. 5
  6. 6 int main()
  7. 7 {
  8. 8 pid_t pid;
  9. 9 //创建第一个子进程
  10. 10 pid = fork();
  11. 11 if (pid < 0)
  12. 12 {
  13. 13 perror("fork error:");
  14. 14 exit(1);
  15. 15 }
  16. 16 //第一个子进程
  17. 17 else if (pid == 0)
  18. 18 {
  19. 19 //子进程再创建子进程
  20. 20 printf("I am the first child process.pid:%d\tppid:%d\n",getpid(),getppid());
  21. 21 pid = fork();
  22. 22 if (pid < 0)
  23. 23 {
  24. 24 perror("fork error:");
  25. 25 exit(1);
  26. 26 }
  27. 27 //第一个子进程退出
  28. 28 else if (pid >0)
  29. 29 {
  30. 30 printf("first procee is exited.\n");
  31. 31 exit(0);
  32. 32 }
  33. 33 //第二个子进程
  34. 34 //睡眠3s保证第一个子进程退出,这样第二个子进程的父亲就是init进程里
  35. 35 sleep(3);
  36. 36 printf("I am the second child process.pid: %d\tppid:%d\n",getpid(),getppid());
  37. 37 exit(0);
  38. 38 }
  39. 39 //父进程处理第一个子进程退出
  40. 40 if (waitpid(pid, NULL, 0) != pid)
  41. 41 {
  42. 42 perror("waitepid error:");
  43. 43 exit(1);
  44. 44 }
  45. 45 exit(0);
  46. 46 return 0;
  47. 47 }

测试结果如下图所示:

0x06 参考资料

《unix环境高级编程》第八章

http://www.rosoo.net/a/201109/15071.html

http://blog.chinaunix.net/uid-1829236-id-3166986.html

http://forkhope.diandian.com/post/2012-10-01/40040574200

http://blog.csdn.net/metasearch/article/details/2498853

http://blog.csdn.net/yuwenliang/article/details/6770750

浅析僵尸进程&孤儿进程的更多相关文章

  1. day34 并行并发、进程开启、僵尸及孤儿进程

    day34 并行并发.进程开启.僵尸及孤儿进程 1.并行与并发 什么是并行? 并行指的是多个进程同时被执行,是真正意义上的同时 什么是并发? 并发指的是多个程序看上去被同时执行,这是因为cpu在多个程 ...

  2. 进程,多进程,进程与程序的区别,程序运行的三种状态,multiprocessing模块中的Process功能,和join函数,和其他属性,僵尸与孤儿进程

    1.进程 什么是进程: 一个正在被运行的程序就称之为进程,是程序具体执行的过程,是一种抽象概念,进程来自操作系统 2.多进程  多个正在运行的程序 在python中实现多线程的方法 from mult ...

  3. 僵尸进程 & 孤儿进程

    参考博文 基本概念 僵尸进程:是所有进程都会进入的一种进程状态,子进程退出,而父进程并没有调用 wait() 或 waitpid() 获取子进程的状态信息,那么子进程的 PID 和 进程描述符 等资源 ...

  4. Go Exec 僵尸与孤儿进程

    原文地址:Go Exec 僵尸与孤儿进程 最近,使用 golang 去管理本地应用的生命周期,期间有几个有趣的点,今天就一起看下. 场景一 我们来看看下面两个脚本会产生什么问题: 创建两个 shell ...

  5. Python并发编程03 /僵孤进程,孤儿进程、进程互斥锁,进程队列、进程之间的通信

    Python并发编程03 /僵孤进程,孤儿进程.进程互斥锁,进程队列.进程之间的通信 目录 Python并发编程03 /僵孤进程,孤儿进程.进程互斥锁,进程队列.进程之间的通信 1. 僵尸进程/孤儿进 ...

  6. wait、waitpid 僵尸进程 孤儿进程

    man wait: NAME wait, waitpid, waitid - wait for process to change state SYNOPSIS #include <sys/ty ...

  7. day 7-3 僵尸进程,孤儿进程与守护进程

    一.基本定义 正常情况下,子进程是通过父进程创建的,子进程在创建新的进程.子进程的结束和父进程的运行是一个异步过程,即父进程永远无法预测子进程 到底什么时候结束. 当一个 进程完成它的工作终止之后,它 ...

  8. linux下的进程(孤儿进程、僵尸进程)

    linux提供了一种机制可以保证只要父进程想知道子进程结束时的状态信息,就可以得到.这种机制就是:在每个进程退出的时候,内核释放该进程所有的资源,包括打开文件,占用的内存等.但是仍然为其保留一定的信息 ...

  9. 僵尸进程&孤儿进程

    http://www.cnblogs.com/Anker/p/3271773.html

随机推荐

  1. asp.net+mvc+easyui+sqlite 简单用户系统学习之旅(五)—— 解决tabs选择已建tab显示但datagrid的toolbar消失的问题

    项目需要反复运行,调整bug.发现在选择已有选项卡时,虽然不需要再新建tab,直接跳转到已有的tab上,但问题是显示的datagrid有事会出现toolbar消失的问题.网上也有不少同学出现类似问题, ...

  2. web页面性能分析一些网址

    https://developers.google.com/speed/pagespeed/insights/

  3. Atitit.数据库分区的设计 attilax  总结

    Atitit.数据库分区的设计 attilax  总结 1. 分区就是分门别类的文件夹 (what)1 2. 分区的好处(y)1 3. 分区原则(要不要分区,何时分区)how2 4. 主要的分表类型有 ...

  4. sql语句优化技巧

    1.对查询进行优化,要尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索 ...

  5. 浅谈Java中的System.gc()的工作原理

    很多人把Java的“效率低下”归咎于不能自由管理内存,但我们也知道将内存管理封装起来的好处,这里就不赘述. Java中的内存分配是随着new一个新的对象来实现的,这个很简单,而且也还是有一些可以“改进 ...

  6. PyTorch在64位Windows下的Conda包(转载)

    PyTorch在64位Windows下的Conda包 昨天发了一篇PyTorch在64位Windows下的编译过程的文章,有朋友觉得能不能发个包,这样就不用折腾了.于是,这个包就诞生了.感谢@晴天14 ...

  7. Javascript模块规范

    因为有了模块,就可以更方便地使用别人的代码,想要什么功能,就加载什么模块.但是有一个前提,就是大家必须以同样的方式编写模块. 目前,通行的Javascript模块规范共有两种:CommonJS和AMD ...

  8. hud项目lcd调试

    lcd规格: 像素:480x280 bpp:16 pix_format:RGB565 在开发板终端中执行: ls /dev/fb0 -l ---> crw-rw----    1 root   ...

  9. 常用校验算法CRC、MD5、SHA_转

    1.算法概述 数据摘要算法是密码学算法中非常重要的一个分支,它通过对所有数据提取指纹信息以实现数据签名.数据完整性校验等功能,由于其不可逆性,有时候会被用做敏感信息的加密.数据摘要算法也被称为哈希(H ...

  10. error: xslt-config not found. Please reinstall the libxslt >= 1.1.0 distribution

    解决编译php扩展xsl时出现 error: xslt-config not found. Please reinstall the libxslt >= 1.1.0 distribution ...