Linux内核第六节 20135332武西垚
- 如何描述一个进程:进程描述符的数据结构;
- 如何创建一个进程:内核是如何执行的,以及新创建的进程从哪里开始执行;
- 使用gdb跟踪新进程的创建过程。
进程的描述
操作系统三大功能:
- 进程管理(最核心最基础)
- 内存管理
- 文件系统
进程描述符task_struct数据结构
task _ struct:为了管理进程,内核必须对每个进程进行清晰的描述,进程描述符提供了内核所需了解的进程信息。struct task_struct数据结构很庞大。
进程的状态:Linux进程的状态(就绪态、运行态、阻塞态)与操作系统原理中的描述的进程状态有所不同,比如就绪状态和运行状态都是TASK_RUNNING,当一个进程处于TASK_RUNNING的时候是可运行的,至于有没有运行其中的区别就在于有没有获得CPU的使用权。
进程的标示pid:用来标示进程
进程描述符task_struct数据结构
struct task_struct {
volatile long state; /* 进程的运行状态-1 unrunnable, 0 runnable, >0 stopped */
void *stack; /*指定了进程的内核堆栈*/
atomic_t usage;
unsigned int flags; /* 每一个进程的标识符 */
unsigned int ptrace;
int on_rq;/运行队列和进程调度相关/
进程调度的链表
所有进程链表struct list_head tasks;
struct list_head{
struct list_head *next,*prev;
};
内核的双向循环链表的实现方法:一个更简略的双向循环链表。
进程的地址空间内存管理相关
struct mm_struct *mm, *active_mm;
进程标示(pid)
pid_t pid;
pid_t tgid;
进程父子关系
程序创建的进程具有父子关系,在编程时往往需要引用这样的父子关系。进程描述符中有几个域用来表示这样的关系
struct task_struct __rcu *real_parent; /* real parent process */
struct task_struct __rcu *parent; /* recipient of SIGCHLD, wait4() reports */
struct list_head children; /* list of my children */
struct list_head sibling; /* linkage in my parent's children list */
struct task_struct *group_leader; /* threadgroup leader */
调试
struct list_head ptraced;
struct list_head ptrace_entry;
当前任务相关的CPU状态
struct thread_struct thread;
Linux为每个进程分配一个8KB大小的内存区域,用于存放该进程两个不同的数据结构:Thread_info和进程的内核堆栈
进程的创建
进程的创建
start _ kernel代码中的rest _ init创建两个内核线程,kernel _ init和kthreadd。kernel _ init将用户态进程init启动,是所有用户态进程的祖先,kthreadd是所有内核线程的祖先。
在命令行下创建进程和启动内核的原理是大致相同的,复制一份0号进程描述符,然后根据进程需要将pid等数据结构修改,就完成了进程的创建。
fork一个进程的用户态代码
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
int main(int argc, char * argv[])
{
int pid;
/* fork another process */
pid = fork();//fork是在用户态用于创建一个子进程的系统调用
if (pid < 0)
{
/* error occurred */
fprintf(stderr,"Fork Failed!");
exit(-1);
}
else if (pid == 0)
{
/* child process */
printf("This is Child Process!\n");
}
else
{
/* parent process */
printf("This is Parent Process!\n");
/* parent will wait for the child to complete*/
wait(NULL);
printf("Child Complete!\n");
}
}
fork系统调用在父进程和子进程各返回一次,在子进程中返回的pid是0,父进程中的返回值子进程的pid,所以程序中的else if(pid==0)和else都会被执行,它的背后有两个进程,可以利用这一点在用户态创建子进程。
创建一个新进程在内核中的执行过程
系统调用再回顾:见第四节博客http://www.cnblogs.com/July0207/p/5277774.html
fork、vfork和clone三个系统调用都可以创建一个新进程,而且都是通过调用do_fork来实现进程的创建
Linux通过复制父进程来创建一个新进程,大部分信息都是相同的,少数信息需要修改,否则就会发生混乱。例如:pid、进程链表、内核堆栈、进程执行上下文thread等,并设置好fork返回的下一条指令(esp和eip)。由此得出进程创建的一个大致框架:
复制一个PCB——task_struct
p = dup_task_struct(current);//复制进程的PCB
int __weak arch_dup_task_struct(struct task_struct *dst,struct task_struct *src)
{
*dst = *src;//通过赋值实现复制
return 0;
}
给新进程分配一个新的内核堆栈
ti = alloc_thread_info_node(tsk, node);
tsk->stack = ti;
setup_thread_stack(tsk, orig); //这里只是复制thread_info,而非复制内核堆栈
修改复制过来的进程数据,比如pid、进程链表等(见copy_process内部)。
/*copy_thread in copy_process*/
/*拷贝内核堆栈数据和指定新进程的第一条指令地址*/
*childregs = *current_pt_regs(); //复制内核堆栈,只复制了SAVE_ALL相关的部分
childregs->ax = 0; //子进程的fork返回0的原因
p->thread.sp = (unsigned long) childregs; //调度到子进程时的内核栈顶
p->thread.ip = (unsigned long) ret_from_fork; //调度到子进程时的第一条指令地址
创建的新进程开始启动的位置
int指令和SAVE_ALL压到内核栈的内容:系统调用压栈的相关数据结构,系统调用号,寄存器参数。
当子进程获得CPU的控制权开始运行的时候,ret _ form _ fork可以将后面的堆栈出栈,从iret返回到用户态,从而切换到子进程的用户空间。
实验——使用gdb跟踪创建新进程的过程
将menu目录删除,利用git命令克隆一个新的menu目录。
rm menu -rf
git clone https://github.com/mengning/menu.git
用test_fork.c将test.c覆盖,然后重新编译footfs
mv test_fork.c test.c
make rootfs
可以看到fork函数的运行结果:
gdb准备调试,加载符号表并设置端口。
file linux-3.18.6/vmlinux
target remote:1234
设置断点:
- 单步执行:
(由于这里报错原因不明,没有办法进行单步调试,后续的实验在实验楼环境下完成。)
(1)使用命令c继续执行,可看到执行到do_fork处
(2)单步执行到copy_process
(3)之后进入dup _ task _ struct
(4)继续执行可到copy_thread
(5)之后可跟踪到ret _ form _ fork,不能继续跟踪执行,结束调试。
总结:通过使用gdb跟踪创建新进程的过程,可以看出创建一个新进程的过程如下:
- 首先调用do_fork函数(函数功能是fork一个新的进程);
- do _ fork中的copy _ process函数复制父进程的相关信息
- dup _ task _ struct()复制进程的PCB
- thread相关代码给新进程分配一个新的内核堆栈,copy _ thread复制内核堆栈,只复制SAVE _ ALL相关的部分
- 设置sp调度到子进程时的内核栈顶,ip转到子进程时的第一条指令地址
- 当子进程获得CPU的控制权开始运行的时候,ret _ form _ fork可以将后面的堆栈出栈,从iret返回到用户态,从而切换到子进程的用户空间,完成新进程的创建。
Linux内核第六节 20135332武西垚的更多相关文章
- Linux内核第四节 20135332武西垚
实验目的: 使用库函数API和C代码中嵌入汇编代码两种方式使用同一个系统调用 实验过程: 查看系统调用列表 get pid 函数 #include <stdio.h> #include & ...
- Linux内核第五节 20135332武西垚
20135332武西垚 在MenuOS中通过添加代码增加自定义的系统调用命令 使用gdb跟踪调试内核 简单分析system_call代码了解系统调用在内核代码中的处理过程 由于本周实验是在Kali虚拟 ...
- Linux内核第七节 20135332武西垚
预处理.编译.链接和目标文件的格式 可执行程序是怎么得来的 以C语言为例,c代码经过编译器的预处理,编译成汇编代码,由汇编器编译成目标代码,再链接成可执行文件,由操作系统加载到cpu里来执行. (截图 ...
- Linux内核总结博客 20135332武西垚
http://www.cnblogs.com/wuxiyao/p/5220677.htmlhttp://www.cnblogs.com/wuxiyao/p/5247571.htmlhttp://www ...
- Linux内核第三节 20135332武西垚
总结部分: Linux内核源代码: Arch 支持不同cpu的源代码:主要关注x86 Init 内核启动的相关代码:主要关注main.c,整个Linux内核启动代码start_kernel函数 K ...
- Linux内核第八节 20135332武西垚
第一种分类: I/O-bound:频繁进行I/O,并且需要花费很多时间等待I/O完成 CPU-bound:计算密集,需要大量的CPU时间进行运算 第二种分类: 批处理进程:不必与用户交互,常在后台进行 ...
- (笔记)Linux内核学习(六)之并发和同步概念
一 临界区和竞争条件 临界区:访问和操作共享数据的代码段. 竞争条件:多个执行线程处于同一个临界区中. 处于竞争条件:造成访问的数据或者资源不一致状态: 对资源i的访问:ProcessA和B访问后得到 ...
- Linux内核第二节
作者:武西垚 深入理解函数调用堆栈 堆栈是C语言程序运行时必须的一个记录调用路径和参数的空间 堆栈的作用 函数调用框架 传递参数 保存返回地址 提供局部变量空间 堆栈相关的寄存器 esp,堆栈指针,指 ...
- 《Linux内核分析》 第六节 进程的描述和进程的创建
<Linux内核分析> 第六节 进程的描述和进程的创建 20135307 张嘉琪 原创作品转载请注明出处 +<Linux内核分析>MOOC课程http://mooc.study ...
随机推荐
- 17秋 软件工程 团队第五次作业 Alpha Scrum7
17秋 软件工程 团队第五次作业 Alpha Scrum7 今日完成的任务 世强:部员详情列表的编写与数据交互,完善APP通知模块: 港晨:完成前端登陆界面编写: 树民:完善Web后端数据库访问模块: ...
- .whl文件打开方式 Python
wheel文件本质上就是zip或者rar,只不过他更加方便python的安装以及使用.在之前的图片中我们只要使用pip install wheel 就可以安装wheel. 在安装了wheel之后我们可 ...
- Unity手游之路手游代码更新策略探讨
版权声明: https://blog.csdn.net/janeky/article/details/25923151 这几个月公司项目非常忙.加上家里事情也多,所以blog更新一直搁置了. 近期在项 ...
- BZOJ1006:[HNOI2008]神奇的国度(弦图染色)
Description K国是一个热衷三角形的国度,连人的交往也只喜欢三角原则.他们认为三角关系:即AB相互认识,BC相互认识,CA相互认识,是简洁高效的. 为了巩固三角关系,K国禁止四边关系,五边关 ...
- OCX ACTIVEX程序打包个人精典案例(OCX)
- 关于ThinkPHP执行长时间任务可能导致PHP使用内存越来越大的问题
ThinkPHP执行长时间任务时,可能导致PHP使用内存越来越大,最后因为内存超出配置限额而程序挂掉. 其实这在很久以前就无意之中发现的一个问题. 3.x之前有这个问题,5.0以后的,应该是已修复了的 ...
- 记录清除wnTKYg挖矿工木马(守护进程ddg.xxxx)的过程
起因,阿里云多次提醒我的一台服务器有恶意发包行为,且给出了一些解决办法.之前也没太在意,就按照解决办法处理了一下.然后过一段时间,还是提示有此行为. 猜肯定是中了木马了,开始以为是被肉鸡了拿来做DDo ...
- 1506 传话 (暴力DFS或者Tarjan模板题)
题目描述 Description 一个朋友网络,如果a认识b,那么如果a第一次收到某个消息,那么会把这个消息传给b,以及所有a认识的人. 如果a认识b,b不一定认识a. 所有人从1到n编号,给出所有“ ...
- CSS3渐变——径向渐变
上节在<再说CSS3渐变——线性渐变>和大家一起学习了CSS3 Gradient中径向渐变最新语法(称得上是W3C的标准语法)相关知识以及其基本使用.今天我们在这一篇中主要和大家一起来了解 ...
- Python--Windows下安装虚拟环境
为什么需要虚拟环境 在python开发中,我们可能会遇到一种情况:就是当前的项目依赖的是某一个版本,但是另一个项目依赖的是另一个版本,这样就会造成依赖冲突.在这种情况之下,我们就需要一个工具能够将这两 ...