kernel笔记——内核编译与进程管理

内核与操作系统

由于一些商业操作系统设计上的缺陷以及日益庞杂，“操作系统”的概念对很多人而言变得含糊不清。在进一步讨论Linux内核的话题前，我们先区分“内核”与“操作系统”这两个概念。

操作系统：指在整个系统中完成最基本功能和系统管理的部分，包括内核、设备驱动、文件管理工具、系统管理工具、shell命令行或其他用户界面(gnome/KDE等)
内核：是操作系统的核心，完成进程管理、cpu调度、内存管理、中断处理等功能

一般我们编写的应用程序，跑在操作系统上，完成文字编辑、音乐播放、网页游览等特定功能。

内核编译

内核源码一般放在/usr/src目录下，我们也可以从这里获取所需内核版本的源码包。编译内核的第一步是配置内核功能，例如配置是否支持对称多处理器(SMP)，可通过设置CONFIG_SMP的值。

通常我们使用"make menuconfig"命令进行配置，其提供了友好的配置界面：

保存配置后，源码目录下将生成.config配置文件，打开该文件，可以看到其内容为各种选项设置：

CONFIG_X86_64=y
CONFIG_64BIT=y
CONFIG_X86=y
CONFIG_SEMAPHORE_SLEEPERS=y
CONFIG_MMU=y
……

我们也可以使用当前的内核配置，使用以下命令快速地生成.config文件：

zcat /proc/config.gz > .config

之后根据.config配置，对源码进行编译：

make -j4

以上使用-j选项，指定并行编译工作任务数目，在多核环境下，减少了编译时间。

编译完成后生成内核压缩镜像：

make bzImage

生成的内核压缩镜像文件位于 arch/x86/boot目录下：

linux-2.6.32.59 # ll arch/x86/boot/bzImage
-rw-r--r-- 1 root root 2814112 07-02 22:27 arch/x86/boot/bzImage

接着安装内核模块:

make modules_install

新的模块会被放置在/lib/modules目录下：

/lib/modules # ll
总计 8
drwxr-xr-x 4 root root 4096 03-08 23:53 2.6.32.12-0.7-default
drwxr-xr-x 3 root root 4096 07-02 23:31 2.6.32.59-0.7-default

最后执行make install安装内核，在/boot目录下将生成System.map、vmlinuz和initrd文件：

linux-2.6.32.59 # make install
sh /home/lx/kernel/linux-2.6.32.59/arch/x86/boot/install.sh 2.6.32.59-0.7-default arch/x86/boot/bzImage \
System.map "/boot"
Kernel image: /boot/vmlinuz-2.6.32.59-0.7-default
Initrd image: /boot/initrd-2.6.32.59-0.7-default
……

完成安装后，在/boot/grub/menu.lst文件中增加了新内核相应的启动项，我们可以修改该文件，指定系统启动后使用新编译的内核。

进程与线程

Linux下，进程与线程的最大不同是进程拥有独立的内存地址空间，而线程与其他线程共享内存地址空间。除此之外，进程与线程的实现基本相同，都有task_struct结构，都被分配PID。

内核线程没有独立的地址空间，它们完成特定工作并接受内核的调度，不同于一般用户进程，它们不接收kill命令发送的信号：

F S UID PID PPID C PRI NI ADDR SZ WCHAN STIME TTY TIME CMD
1 S root 2 1 0 -40 - - 0 migrat Jul01 ? 00:00:00 [migration/0]
1 S root 3 1 0 94 19 - 0 ksofti Jul01 ? 00:00:00 [ksoftirqd/0]
5 S root 18 1 0 70 -5 - 0 worker Jul01 ? 00:00:00 [events/0]
……

task_struct

task_struct结构包含进程使用的虚拟内存、打开的文件、进程状态、进程pid等信息，占用的内存由slab分配，在文件中定义。thread_info结构的第一个字段为task_struct类型的指针，当进程创建时，thread_info存放在进程内核栈的顶部：

current全局变量指向当前运行进程的task_struct结构，由于thread_info存放的位置固定，这样我们通过以下汇编指令就能很容易地计算出current的值：

movl $-8192, %eax
andl $esp, %eax

进程状态

进程可处于以下几种状态：

RUNNING
INTERRUPTABLE
UNINTERRUPTABLE
STOP
ZOMBIE

这些进程状态作为宏，在sched.h文件中被定义。

RUNNING状态表示进程是可执行的，或正在执行或在运行队列中，这些进程占用或等待cpu资源。
进程调用退出函数exit后，进程中止，进入ZOMBIE状态。在ZOMBIE状态下进程不会占用cpu，但因其task_struct结构尚未释放，仍占用一点内存，直到父进程调用wait函数接受子进程遗愿，假如父进程先于子进程退出，则由init进程接受子进程遗愿。如果一个进程长期处于ZOMBIE状态，则是父进程中未调用wait，为程序编码问题。
UNINTERRUPTABLE状态表示进程不可中断，处于此状态的进程处于内核态，并且不接收任何信号。

设置进程状态的函数为set_task_state函数，在文件中定义。

进程间关系

进程间关系与目录结构一样，为树状结构，目录结构以/为根，而进程关系以init为根。我们可以使用pstree查看进程间关系：

linux-14:~ # echo $$
linux-14:~ # pstree -G -p 10939
bash(10939)─┬─pstree(12806)
└─sh(12796)───sleep(12801)

内核代码中提供了一条双向闭环链表，自init进程始，链表连接了所有进程的task_struct结构，可以通过for_each_process宏遍历系统的所有进程：

#define for_each_process(p) \
for (p = &init_task ; (p = next_task(p)) != &init_task ; )

进程创建

Linux kernel将进程创建的步骤分成两步：fork和exec。fork生成子进程的pid，将父进程执行上下文、打开的文件描述符等内容复制一份给子进程；exec将子进程自己的执行上下文加载进内存地址空间。有以下fork例子，问执行该程序将输出多少个1？

#include <stdio.h>
#include <unistd.h>
int main()
{
int i;
for(i=0 ; i < 10; i++)
{
fork();
}
printf("%d\n", 1);
return 0;
}

fork拷贝父进程的内容到子进程，开销较大，假若调用fork之后马上调用exec，子进程加载自己的执行文件，则拷贝的动作就是多余的。写时拷贝(copy-on-write,COW)解决了拷贝带来无谓开销的问题，在子进程写父进程地址空间时，才触发拷贝的动作。不做多余事情、非到不得已的时候才完成工作，这也是Linux kernel高效的原因之一。

内核中do_fork函数完成fork调用的工作，do_fork调用copy_process。copy_process函数中主要完成以下工作：

调用dup_task_struct函数申请新进程的task_struct、thread_info结构
根据clone_flags标志，调用copy_files、copy_fs、copy_mm等函数完成文件、文件系统、内存等信息的拷贝
调用alloc_pid申请新进程pid

fork返回两次，在do_fork函数中实现。

进程中止

最终进程会调用exit函数中止，exit系统调用最终会调用内核中do_exit函数，do_exit在中定义，其完成以下工作：

调用exit_signals设置进程flags标志为PF_EXITING
调用exit_mm、exit_files、exit_fs等函数释放进程内存、文件、文件系统等结构
设置进程的exit_code
调用exit_notify，向当前进程的父进程、子进程发送信号，告知当前进程将要中止，并设置当前进程退出状态exit_state为EXIT_DEAD或EXIT_ZOMBIE
调用schedule，切换到另一个进程，从do_exit函数不会返回到调用它的函数

Reference: Chapter 1 to chapter 3, Linux kernel development.3rd.Edition

kernel笔记——内核编译与进程管理的更多相关文章

《Linux内核设计与实现》读书笔记第三章进程管理
第三章进程管理进程是Unix操作系统抽象概念中最基本的一种.我们拥有操作系统就是为了运行用户程序,因此,进程管理就是所有操作系统的心脏所在. 3.1进程概念: 进程:处于执行期的程序.但不仅局限于 ...
Linux内核学习笔记（1）-- 进程管理概述
一.进程与线程进程是处于执行期的程序,但是并不仅仅局限于一段可执行程序代码.通常,进程还要包含其他资源,像打开的文件,挂起的信号,内核内部数据,处理器状态,一个或多个具有内存映射的内存地址空间及一个 ...
Linux学习笔记（5）-进程管理
进程简介进程是正在执行的一个程序或命令,每一个进程都有自己的地址空间,并占有一定的系统资源.感性的认识,进程就是一个正在运行的程序进程管理的作用判断服务器的运行状态查看系统中有哪些进程杀死进 ...
kernel笔记——内核同步与锁
内核同步内核同步解决并发带来的问题,多个线程对同一数据进行修改,数据会出现不一致的情况,同步用于保护共享数据等资源. 有两种形式的并发: 同时进行式并发,在不同cpu上执行的进程同时访问共享数据二 ...
UNIX环境编程学习笔记（21）——进程管理之获取进程终止状态的 wait 和 waitpid 函数
lienhua342014-10-12 当一个进程正常或者异常终止时,内核就向其父进程发送 SIGCHLD信号.父进程可以选择忽略该信号,或者提供一个该信号发生时即被调用的函数(信号处理程序).对于这 ...
UNIX环境编程学习笔记（19）——进程管理之fork 函数的深入学习
lienhua342014-10-07 在“进程控制三部曲”中,我们学习到了 fork 是三部曲的第一部,用于创建一个新进程.但是关于 fork 的更深入的一些的东西我们还没有涉及到,例如,fork ...
UNIX环境编程学习笔记（18）——进程管理之进程控制三部曲
lienhua342014-10-05 1 进程控制三部曲概述 UNIX 系统提供了 fork.exec.exit 和 wait 等基本的进程控制原语.通过这些进程控制原语,我们即可完成对进程创建.执 ...
UNIX环境编程学习笔记（17）——进程管理之进程的几个基本概念
lienhua342014-10-05 1 main 函数是如何被调用的? 在编译 C 程序时,C 编译器调用链接器在生成的目标可执行程序文件中,设置一个特殊的启动例程为程序的起始地址.当内核执行 C ...
UNIX环境编程学习笔记（15）——进程管理之进程终止
lienhua342014-10-02 1 进程的终止方式进程的终止方式有 8 种,其中 5 种为正常终止,它们是 1. 从 main 返回. 2. 调用 exit. 3. 调用_exit 或_Ex ...

随机推荐

基于winserver部署Apollo初次体验（附.net客户端demo）
前言配置中心伴随着这几年分布式系统演变和微服务架构的兴起,已经成为必不可少的需求之一.试下一下如果哪天公司的所有应用服务,从公司服务器迁移到云服务,成千上万的配置,修改起来是多么耗时费劲的事(我们公 ...
.Net Core中的Api版本控制
原文链接:API Versioning in .Net Core 作者:Neel Bhatt 简介 Api的版本控制是Api开发中经常遇到的问题, 在大部分中大型项目都需要使用到Api的版本控制在本 ...
知其所以然~redis的原子性
原子性原子性是数据库的事务中的特性.在数据库事务的情景下,原子性指的是:一个事务(transaction)中的所有操作,要么全部完成,要么全部不完成,不会结束在中间某个环节. 对于Redis而言,命 ...
python学习第三讲,python基础语法之注释,算数运算符,变量.
目录 python学习第三讲,python基础语法之注释,算数运算符,变量. 一丶python中的基础语法,注释,算数运算符,变量 1.python中的注释 2.python中的运算符. 3.pyth ...
Using rqt_console and roslaunch
Description: This tutorial introduces ROS using rqt_console and rqt_logger_level for debugging and r ...
My操作小技巧
1.当我们新增一条数据之后想要获取其自增长的id,可以紧随新增语句后调用 SELECT last_insert_id();即可获得,一般搭配变量一起使用 SELECT @newUserId:=last ...
python学习笔记(十三)、网络编程
最近心情有点儿浮躁,难以静下心来 Python提供了强大的网络编程支持,很多库实现了常见的网络协议以及基于这些协议的抽象层,让你能够专注于程序的逻辑,而无需关心通过线路来传输比特的问题. 1 几个网络 ...
环境搭建 - Maven（Windows）
Maven环境搭建本文以windows7下搭建Maven-3.5.0为示例下载Maven压缩包网址:Maven 非C盘根目录下新建文件夹:Maven D:\Maven 在Maven目录下新建文件 ...
安装屏保软件（Linux终端演示 “黑客帝国” 字母雨界面）和Linux修改管理员密码
1.Linux修改管理员密码:打开终端:1. 重启 reboot 2.进入内核登陆系统点击e3.进入系统救援界面,定位Linux16所在行,找到ro 后删除,在此位置添加一条命令: rw init= ...
Dynamics Customer Engagement V9版本配置面向Internet的部署时候下一步按钮不可点击的解决办法
微软动态CRM专家罗勇 ,回复299或者20190120可方便获取本文,同时可以在第一间得到我发布的最新博文信息,follow me!我的网站是 www.luoyong.me . Dynamics 3 ...

kernel笔记——内核编译与进程管理

kernel笔记——内核编译与进程管理的更多相关文章

随机推荐

热门专题