Linux内核学习笔记二——进程

 

一 进程与线程

进程就是处于执行期的程序,包含了独立地址空间,多个执行线程等资源。

线程是进程中活动的对象,每个线程都拥有独立的程序计数器、进程栈和一组进程寄存器。

内核调度的对象是线程而不是进程。对Linux而言,线程是特殊的进程。

二 进程描述符及任务结构

内核使用双向循环链表的任务队列来存放进程,使用结构体task_struct来描述进程所有信息。

1 进程描述符task_struct

struct task_struct {}结构体相当大,大约1.7K字节。大概列出一些看看:

    

2 分配进程描述符

  当进程由于中断或系统调用从用户态转换到内核态时,进程所使用的栈也要从用户栈切换到内核栈。

通过内核栈获取栈尾thread_info,就可以获取当前进程描述符task_struct。

每个进程的thread_info结构在他的内核栈的尾端分配。结构中task域中存放是指向该任务实际的task_struct。

    

内核处理进程就是通过进程描述符task_struct结构体对象来操作。所以操作进程要获取当前正在运行的进程描述符。

通过thread_info的地址就可以找到task_struct地址;在不同的体系结构上计算thread_info的偏移地址不同。

  1. /* linux-2.6.38.8/arch/arm/include/asm/current.h */
  2. static inline struct task_struct *get_current(void)
  3. {
  4. return current_thread_info()->task;
  5. }
  6.  
  7. #define current (get_current())
  8. /* linux-2.6.38.8/arch/arm/include/asm/thread_info.h */
  9. static inline struct thread_info *current_thread_info(void)
  10. {
  11.    //栈指针
  12. register unsigned long sp asm ("sp");
  13. return (struct thread_info *)(sp & ~(THREAD_SIZE - 1));
  14. }

3 进程的状态

系统中的每个进程都必然处于五种进程状态中的一种或进行切换。该域的值也必为下列五种状态标志之一:

TASK_RUNNING(运行)—进程是可执行的;它或者正在执行,或者在运行队列中等待执行(运行队列将会在第4章中讨论)。

这是进程在用户空间中执行的唯一可能的状态;这种状态也可以应用到内核空间中正在执行的进程。

TASK_INTERRUPTIBLE(可中断)—进程正在睡眠(也就是说它被阻塞),等待某些条件的达成。一旦这些条件达成,

内核就会把进程状态设置为运行。处于此状态的进程也会因为接收到信号而提前被唤醒并随时准备投入运行。

TASK_UNINTERRUPTIBLE(不可中断)—除了就算是接收到信号也不会被唤醒或准备投入运行外,这个状态与可打断状态相同。

这个状态通常在进程必须在等待时不受干扰或等待事件很快就会发生时出现。由于处于此状态的任务对信号不做响应,

所以较之可中断状态,使用得较少。

__TASK_TRACED—被其他进程跟踪的进程,例如通过ptrace对调试程序进行跟踪。

__TASK_STOPPED(停止)—进程停止执行;进程没有投入运行也不能投入运行。通常这种状态发生在接收到SIGSTOP、

SIGTSTP、SIGTTIN、SIGTTOU等信号的时候。此外,在调试期间接收到任何信号,都会使进程进入这种状态。

三 进程创建

fork:copy当前进程创建一个新的进程;

exec:读取可执行文件并将其载入地址空间开始运行。

1 fork过程

创建进程都是通过调用do_fork函数完成,其中提供了很多参数标志来表明进程创建的方式。

  1. long do_fork(unsigned long clone_flags,
  2. unsigned long stack_start,
  3. struct pt_regs *regs,
  4. unsigned long stack_size,
  5. int __user *parent_tidptr,
  6. int __user *child_tidptr)
  7.  
  8. {
  9. struct task_struct *p;
  10. ……
  11.  
  12. //创建进程
  13. p = copy_process(clone_flags, stack_start, regs, stack_size,
  14. child_tidptr, NULL, trace);
  15. ……
  16. //将进程加入到运行队列中
  17. wake_up_new_task(p);
  18. }

copy_process里面通过父进程创建子进程,并未执行:

  1. task_struct *copy_process(unsigned long clone_flags,
  2. unsigned long stack_start,
  3. struct pt_regs *regs,
  4. unsigned long stack_size,
  5. int __user *child_tidptr,
  6. struct pid *pid,
  7. int trace)
  8.  
  9. {
  10. struct task_struct *p;
  11. //创建进程内核栈和进程描述符
  12. p = dup_task_struct(current);
  13.  
  14. //得到的进程与父进程内容完全一致,初始化新创建进程
  15. ……
  16. return p;
  17. }

dup_task_struct根据父进程创建子进程内核栈和进程描述符:

  1. static struct task_struct *dup_task_struct(struct task_struct *orig)
  2. {
  3. struct task_struct *tsk;
  4. struct thread_info *ti;
  5. int node = tsk_fork_get_node(orig);
  6.  
  7. //创建进程描述符对象
  8. tsk = alloc_task_struct_node(node);
  9. //创建进程内核栈 thread_info
  10. ti = alloc_thread_info_node(tsk, node);
  11.  
  12. //使子进程描述符和父进程一致
  13. err = arch_dup_task_struct(tsk, orig);
  14.  
  15. //进程描述符stack指向thread_info
  16. tsk->stack = ti;
  17.  
  18. //使子进程thread_info内容与父进程一致但task指向子进程task_struct
  19. setup_thread_stack(tsk, orig);
  20.  
  21. return tsk;
  22.  
  23. }

创建进程copy_process之后并未执行,返回到do_fork中,将新创建进程加入到运行队列中等待被执行。

四 线程在Linux中的实现与内核线程

线程机制提供了在同一个程序共享内存地址空间,文件等资源的一组线程。在Linux内核中把所有线程都当做进程来实现。

内核并没有提供调度算法,或者数据结构来表征线程,而是作为与其他进程共享资源的进程;与其他系统不同。

内核线程与普通进程间的区别是:

内核线程没有独立的地址空间

只在内核空间运行,不会切换到用户空间

五 进程终结

进程终结时内核释放其所占有的资源,并告诉父进程,更新父子关系。调用exit终结进程,进程被终结时通常最后都要调用do_exit来处理。

  1. void do_exit(long code)
  2. {
  3. //获取当前运行进程
  4. struct task_struct *tsk = current;
  5. ……
  6.  
  7. //sets PF_EXITING
  8. exit_signals(tsk);
  9.  
  10. //释放task_struct的mm_struct内存
  11. exit_mm(tsk);
  12.  
  13. //退出接收IPC信号队列
  14. exit_sem(tsk);
  15.  
  16. //进程名字空间
  17. exit_shm(tsk);
  18.  
  19. //文件描述符
  20. exit_files(tsk);
  21.  
  22. //文件系统
  23. exit_fs(tsk);
  24.  
  25. //资源释放
  26. exit_thread();
  27.  
  28. //向父进程发送信号
  29. exit_notify(tsk, group_dead);
  30. ……
  31.  
  32. //切换到其他进程
  33. tsk->state = TASK_DEAD;
  34. tsk->flags |= PF_NOFREEZE;
  35. schedule();
  36. ……
  37. }

Linux内核学习笔记二——进程的更多相关文章

  1. Linux内核学习笔记-2.进程管理

    原创文章,转载请注明:Linux内核学习笔记-2.进程管理) By Lucio.Yang 部分内容来自:Linux Kernel Development(Third Edition),Robert L ...

  2. Linux内核学习笔记-1.简介和入门

    原创文章,转载请注明:Linux内核学习笔记-1.简介和入门 By Lucio.Yang 部分内容来自:Linux Kernel Development(Third Edition),Robert L ...

  3. 20135316王剑桥Linux内核学习笔记

    王剑桥Linux内核学习笔记 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 计算机是如何工作的 个人理 ...

  4. linux内核学习之二:编译内核

    在linux内核学习系列的第一课中讲述了搭建学习环境的过程(http://www.cnblogs.com/xiongyuanxiong/p/3523306.html),环境搭好后,马上就进入到下一环节 ...

  5. 马哥Linux SysAdmin学习笔记(二)

    Linux网络属性管理: 局域网:以太网,令牌环网 Ethernet:CSMA/CD 冲突域 广播域 MAC:media access control地址 48bit: 24bits 24bits  ...

  6. Linux内核学习笔记(1)-- 进程管理概述

    一.进程与线程 进程是处于执行期的程序,但是并不仅仅局限于一段可执行程序代码.通常,进程还要包含其他资源,像打开的文件,挂起的信号,内核内部数据,处理器状态,一个或多个具有内存映射的内存地址空间及一个 ...

  7. linux内核学习之二 一个精简内核的分析(基于时间片轮转)

    一   实验过程及效果 1.准备好相关的代码,分别是mymain.c,mypcb.h,myinterrupt.c ,如下图,make make成功: 在qemu创建的虚拟环境下的运行效果:(使用的命令 ...

  8. Linux内核学习笔记——内核内存管理方式

    一 页 内核把物理页作为内存管理的基本单位:内存管理单元(MMU)把虚拟地址转换为物理 地址,通常以页为单位进行处理.MMU以页大小为单位来管理系统中的也表. 32位系统:页大小4KB 64位系统:页 ...

  9. linux内核学习之四:进程切换简述

    在讲述专业知识前,先讲讲我学习linux内核使用的入门书籍:<深入理解linux内核>第三版(英文原版叫<Understanding the Linux Kernel>),不过 ...

随机推荐

  1. 基于lfslivecd-x86-6.3-r2145安装vnc和qemu

    文章目录 把lfslivecd复制到硬盘上使用 编译安装vnc 前后下载了多个软件包进行编译安装 编译VNC 启动VNC 编译安装qemu 启动VNC客户端并连接虚拟机的vncviewer 把lfsl ...

  2. Java打印九九乘法表及倒打九九乘法表

    //正打 public class Test3 { public static void main(String[] args) { for(int j=1;j<10;j++){ for(int ...

  3. Singer 学习六 运行&&开发taps、targets (一 taps 运行说明)

    文章内容来来自官方github 说明: singer大部分的taps && targets 是用python编写的,所以内容里面的代码也是使用python 编写 使用python运行s ...

  4. hasura graphql-engine v1.0.0-alpha30 remote schema stitch 试用

    新的hasura graphql-engine 代码仓库中已经包含了一个基于express 的简单graphql server, 可以用来测试模式拼接 graphql server 代码 项目结构 ├ ...

  5. Python之安装pip

    安装Python之后,命令行语句定位到其安装目录下的Scripts目录 如我的安装目录是:D:\python\Scripts 然后执行命令:easy_install.exe pip就会开始安装pip ...

  6. Git上传空文件夹的方法

    之前发现很多项目文件夹下又.gitkeep文件,不知道它的用处. 直到前段时间遇到一个问题,Git如何上传空文件夹? 默认情况下,Git不会上传本地空文件夹,如果有些特殊场合需要的话,一个简单的方法是 ...

  7. mongodb之 3.4.0 mongodb sharing 副本集群搭建

    系统系统 centos6.5三台服务器:10.100.25.42/43/44安装包: mongodb-linux-x86_64-rhel62-3.4.0.tgz 服务器规划:mongos mongos ...

  8. nonzero

    在python的numpy里面这个函数的意义是返回参数数组中不为0的元素的索引(indics). from numpy import array from numpy import nonzero x ...

  9. Hibernate更新删除数据后,再查询数据依然存在的解决办法

    删除数据后,重新查询了数据库,DB中记录已经删除了,但是数据依然能查询到,网上都说是Hibernate的缓冲问题. 我对session进行了clear,flush,并且在事务和查询中都对session ...

  10. golang查看channel缓冲区的长度

    golang提供内建函数cap用于查看channel缓冲区长度. cap的定义如下: func cap(v Type) int The cap built-in function returns th ...