4.1 前言

本章讨论进程概念、资源、属性。

4.2 内核和进程的关系

当系统启动时,内核代码被加载到内存,初始化之后,启动第一个用户进程,然后内核的代码就等着用户进程来调度了。

4.3 进程是程序的实例

当程序员编写好一个程序,编译之后会生成这个可执行程序,这个程序可以被运行。

运行程序其实是用户进程(Shell进程)指示内核要启动另一个用户进程,内核便为这个新的进程分配资源,并加载该进程的代码和数据。

一个程序可以被运行多次。

4.3 进程资源

4.3.1 PCB

进程运行时,内核为进程每个进程分配一个PCB(进程控制块),描述进程的信息。

PCB在内核中对应的结构体是task_struct

4.3.2 虚拟地址空间

每个进程都会分配虚拟地址空间,在32位机器上,该地址空间为4G。

更细节的图例

在进程里平时所说的指针变量,保存的就是虚拟地址。当应用程序使用虚拟地址访问内存时,处理器(CPU)会将其转化成物理地址。

int* p = malloc(100);
*p = 100;
访问内存时,系统会做地址转换。

这样做的好处在于:

  • 进程隔离,更好的保护系统安全运行

  • 屏蔽物理差异带来的麻烦,方便操作系统和编译器安排进程地址

思考:如果实现一个智能的myfree函数,该函数会自动判断指针是否在堆上还是在栈上,还是在全局变量中。

4.3.3 CPU

CPU的分配是动态的,不是进程一加载就直接分配的,一般来说每个系统都会有许多进程同时在运行,而CPU只有一个(多核CPU可以认为是多个,但是数量远少于进程数量)。那么,进程就需要排队等待,就好像有100个人,在4个卖饭的窗口买饭一样。

内核将进程PCB放入一个队列,总是让CPU服务队列中的第一个进程,服务时间可以是10毫秒,可以是25毫秒,具体多长时间跟具体系统有关系,这个时间有个名字叫做时间片。一旦这个进程服务时间到,这个进程会被丢到队列尾部,进行排队。进程调度。

内核中有一个常量HZ,一般是100,250, 1000

4.4 进程属性和状态

进程有许多的属性和状态,具体可以看task_struct,这里挑一些常见的进行讲解。

4.4.1 PID

进程编号,内核为每个进程分配一个进程编号,这个是进程的身份证,系统保证了不会重复分配。
通过函数getpid或者命令ps可以查看进程的PID。

#include <sys/types.h>
#include <unistd.h>
#include <stdio.h>

int main()
{
    pid_t pid = getpid();
    pid_t ppid = getppid();
    printf("%d\n", (int)pid);
    printf("%d, %d\n", (int)pid, (int)ppid);
}

4.4.2 PPID

PPID就是父进程ID,在Linux系统中,除了内核启动的第一个进程,其它进程都有父进程。
通过函数getppid或者命令ps可以查看进程的PPID。

4.4.3 账户ID/组ID

账户分实际账户和有效账户两种,如果你使用test账户登陆系统,但是使用sudo运行程序时,实际账户时test,有效账户时root。

通过函数getuidgeteuid获取真实账户id和有效账户id
通过函数getgidgetegid获得真实账户id和有效账户id
通过setuidsetgidseteuidsetegidsetreuidsetregid等设置进程的有效和真实账户id。

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h> int main()
{
uid_t uid = getuid();
uid_t euid = geteuid();
printf("uid =%d, euid=%d\n", (int)uid, (int)euid);
}

4.4.4 进程组ID/会话组ID/控制终端

进程组:getpgrpsetpgid
会话组:getsidsetsid
控制终端:

4.4.5 环境变量

保存该进程运行的环境信息。
进程的环境变量保存在全局变量environ中,
也可以通过setenvgetenvunsetenv进行设置和获取。

4.4.6 进程状态

#define TASK_RUNNING            0 可运行状态,相当于进程三种状态的执行和就绪状态
#define TASK_INTERRUPTIBLE      1 中断等待状态。处于这种状态唤醒的原因可能是信号或定时中断,或者I\O就绪
#define TASK_UNINTERRUPTIBLE    2 不可中断等待状态,主要是等待I\O
#define TASK_ZOMBIE             3 僵死状态,进程已经结束已经释放除了PCB以外的部分系统资源,等待父进程wait()读取结束状态
#define TASK_STOPPED            4 进程已经停止
注意:这是0.11的内核,在1.0的内核以上就多了一种状态,在1.0内核的sched.h中有定义
#define TASK_SWAPPING           5 交换状态,进程的页面也可以从内存转换到外存,以空出内存空间

启动进程时,该进程在RUNNING状态,RUNNING状态的进程有可能时正在被执行,或者在队列中排队。但是如果进程调用阻塞函数,而运行条件不满足时,该进程会进入挂起状态。挂起状态的进程不再分配CPU,除非等到运行条件满足时。会阻塞进程运行的函数有许多,比如getchar是典型的阻塞调用。

阻塞函数列表可以在man 7 signal中,找到关于阻塞函数的列表。

4.4.7 文件描述符

在进程控制块中,有一个数组保存着打开的文件描述符信息。

4.4.8 进程时间

进程有一些字段,用来记录进程的运行时间。
通过times可以获取进程从运行开始时到执行times函数时,所花费的时间。这个在系统性能优化时特别重要。
简单的程序可以从time命令获取进程的运行时间。
Linux时间相关函数可以从man 7 time获取。

4.4.10 当前工作目录和根目录

当前工作目录是相对地址的相对目录,通过getcwd函数可以获取当前目录,也可以通过pwd或者echo $PWD获取。也可以通过chdir来修改当前工作目录。
根目录是绝对地址的相对目录,可以通过chroot来修改根目录。调用chroot需要root权限。

目录相关资料在man 7 path_resolution

4.5 动态库和静态库

当使用动态库时,系统会检查该动态库是否已经加载,如果已经加载,则直接映射即可,如果没有加载,那么会加载之后再映射。

如果动态库中有全局变量,那么该全局变量对于不同的进程来说,是相互独立和隔离的。

链接静态库时,静态库被一起编译进可执行程序,运行时不再依赖静态库。

动态库编译:
gcc -fpic -shared a.c b.c -o libtest.so
链接动态库
gcc main.c -ltest -L. -o mybin
运行程序时

export LD_LIBRARY_PATH=.
或者将动态库拷贝到/usr/lib
./mybin

静态库打包:
ar rcs libtest.a a.o b.o

链接库时,如果有同名的动态库和静态库,默认优先动态库,如果要链接静态库,那么使用-static,比如

gcc a.c -lmylib -static

通过以下方式可以指定某些库使用静态链接,而某些库使用动态链接

-Wl,-Bstatic -ltest -Wl,-Bdynamic -ltest2

4.6 内存管理

进程运行时,总是占用内存,无论是加载代码,还是在函数中定义局部变量,还是调用malloc申请内存。

无论是那种原因,进程需要使用内存时,它将向系统申请,并获得相对应的虚拟地址,而进程只能访问虚拟地址,真实的内存地址,进程无法访问。当进程访问虚拟地址时,系统会负责进行虚拟地址到物理地址的转换,系统发现进程尝试访问非法地址,那么进程将得到惩罚(段错误)。

这样做保护了系统的稳定性,不会因为个别新手程序员导致整个系统的崩溃。

另外还有一个好处是,使用虚拟内存之后,每个进程的导致空间是一致的,简化了进程的设计。

相关函数:mallocbrkmmapalloca

4.7 进程总结

从用户的角度看,一个程序跑起来就是进程。而从操作系统的角度看,进程是一个控制块+代码+数据的组合。

4.8 函数和命令

4.8.1 函数

getpid:获取进程ID
getppid:获取父进程ID

getuid:获取实际用户ID
getgid:获取实际组ID
geteuid:获取有效账户ID
getegid:获取有效组ID

进程组描述了一项任务
getpgrp:获取进程组号
setpgid:设置进程组号

setsid:设置Session号
getsid:获得Session号

getcwd:获取当前工作目录
chdir:设置当前工作目录
chroot:修改当前根目录

getenv:环境中取字符串,获取环境变量的值
setenv:改变或增加环境变量
unsetenv
extern char** environ(全局变量)

malloc/free:堆区申请内存
mmap/munmap:在映射区申请内存
brk:全局区申请内存
alloca:在栈上申请内存

int foo(int len)
{
//  char buf[len];
    char* buf = alloca(len);
}

4.8.2 命令

ps axu:现行终端机下的所有程序,以用户为主的格式来显示程序状况,显示所有程序,不以终端机来区分
ps ajx
grep:搜索
kill:杀死进程(给进程发送信号)

Linux第四章 进程的更多相关文章

  1. linux第四章笔记

    第四章 进程调度 调度程序负责决定将哪个进程投入运行,何时运行以及运行多长时间.进程调度程序可看做在可运行态进程之间分配有限的处理器时间资源的内核子系统. 最大限度利用处理器时间的原则:只要有可以执行 ...

  2. linux第四章读书笔记

    第四章 进程调度 一.多任务 多任务操作系统就是能同时并发的交互执行多个进程的操作系统.多任务操作系统使多个进程处于堵塞或者睡眠状态,实际不被投入执行,这些任务尽管位于内存,但是并不处于可运行状态.多 ...

  3. 2013337朱荟潼 Linux第四章读书笔记——进程调度

    第4章 进程调度 0. 总结 调度:调度是一个平衡的过程.一方面,它要保证各个运行的进程能够最大限度的使用CP:另一方面,保证各个进程能公平的使用CPU. 调度功能:决定哪个进程运行以及进程运行多长时 ...

  4. Windows核心编程 第四章 进程(下)

    4.3 终止进程的运行 若要终止进程的运行,可以使用下面四种方法: • 主线程的进入点函数返回(最好使用这个方法) . • 进程中的一个线程调用E x i t P r o c e s s函数(应该避免 ...

  5. windows核心编程---第四章 进程

    上一章介绍了内核对象,这一节开始就要不断接触各种内核对象了.首先要给大家介绍的是进程内核对象.进程大家都不陌生,它是资源和分配的基本单位,而进程内核对象就是与进程相关联的一个数据结构.操作系统内核通过 ...

  6. 20135320赵瀚青LINUX第四章读书笔记

    概述 什么是进程调度 进程调度:在可运行态进程之间分配有限处理器时间资源的内核子系统. 一.调度策略 4.1进程类型 I/O消耗型进程:大部分时间用来提交I/O请求或是等待I/O请求,经常处于可运行状 ...

  7. Windows核心编程 第四章 进程(中)

    4.2 CreateProcess函数 可以用C r e a t e P r o c e s s函数创建一个进程: BOOL CreateProcessW( _In_opt_ LPCWSTR lpAp ...

  8. Windows核心编程 第四章 进程(上)

    第4章 进 程     本章介绍系统如何管理所有正在运行的应用程序.首先讲述什么是进程,以及系统如何创建进程内核对象,以便管理每个进程.然后将说明如何使用相关的内核对象来对进程进行操作.接着,要介绍进 ...

  9. 《Linux内核设计与实现》读书笔记 第四章 进程调度

    第四章进程调度 进程调度程序可看做在可运行太进程之间分配有限的处理器时间资源的内核子系统.调度程序是多任务操作系统的基础.通过调度程序的合理调度,系统资源才能最大限度地发挥作用,多进程才会有并发执行的 ...

随机推荐

  1. vue项目使用.env文件配置全局环境变量

    一.env文件的认识: (1).env 文件主要的作用是存储环境变量,也就是会随着环境变化的东西,比如数据库的用户名.密码.缓存驱动.时区,还有静态文件的存储路径之类的.因为这些信息应该是和环境绑定的 ...

  2. POJ1734 Sightseeing trip (Floyd求最小环)

    学习了一下用Floyd求最小环,思路还是比较清晰的. 1 #include<iostream> 2 #include<cstdio> 3 #include<cstring ...

  3. 认识 Redis client-output-buffer-limit 参数与源码分析

    概述 Redis 的 client-output-buffer-limit 可以用来强制断开无法足够快从 redis 服务器端读取数据的客户端.保护机制规则如下: [hard limit] 大小限制, ...

  4. 手写自定义springboot-starter,感受框架的魅力和原理

    一.前言 Springboot的自动配置原理,面试中经常问到,一直看也记不住,不如手写一个starter,加深一下记忆. 看了之后发现大部分的starter都是这个原理,实践才会记忆深刻. 核心思想: ...

  5. JAVA系列之JVM内存调优

    一.前提 JVM性能调优牵扯到各方面的取舍与平衡,往往是牵一发而动全身,需要全盘考虑各方面的影响.在优化时候,切勿凭感觉或经验主义进行调整,而是需要通过系统运行的客观数据指标,不断找到最优解.同时,在 ...

  6. <一>类,对象,this指针

    C++ 类:实体的抽象类型 实体(属性,行为) ->ADT(abstract data type) 类(属性->成员变量,行为->成员方法) OOP语言4大特征 抽象 封装/隐藏(通 ...

  7. DevOps|乱谈开源社区、开源项目与企业内部开源

    之前的一篇文章<从特拉斯辞职风波到研发效能中的荒唐事>中关于企业内源的内容在研发效能群内引起了大家的热烈讨论.有的小伙伴不同意,有的小伙伴非常不同意,我觉得这都是非常正常的反馈,话不说不透 ...

  8. 介绍一个jmeter录制脚本谷歌插件 —— metersphere-chrome-plugin

    该插件可将用户在浏览器操作时的 HTTP 请求记录下来并生成 JMX 文件(JMeter 脚本文件). 1. 插件解压 插件下载链接: https://pan.baidu.com/s/14nGb_s9 ...

  9. springcloud组件梳理之Feign

    最近刚好打算做一个springcloud系列的分享,趁此机会刚好梳理下springcloud常用组件的使用,今天先对feign做个简单介绍! feign是一个声明式的Web服务客户端,它使得发送web ...

  10. Apache ShenYu 集成 RocketMQ 实时采集海量日志的实践

    本文作者:胡泰室, 快手Java开发工程师. ​ 认识Apache ShenYu(神禹) 网关最重要的是流量治理,而流量治理与大禹治水有很多相似的地方,因此,网关的流量治理项目被命名为神禹. Shen ...