Linux 系统进程管理

目录

一.进程的概述

1.1 什么是进程?

  • program/code 程序,静静放在你的系统中(静态)

  • process 进程,运行起来的程序是个进程,动态运行. (动态)

  • daemon 守护进程(服务),持续运行的进程,一般是系统必须的服务

    (network ,sshd.....)

    比如: 开发写的代码我们称为程序,那么将开发的代码运行起来。我们称为

    进程。

    总结一句话就是: 当我们运行一个程序,那么我们将运行的程序叫进程。

    PS1: 当程序运行为进程后,系统会为该进程分配内存,以及进程运行的身

    份和权限。

    PS2: 在进程运行的过程中,系统会有各种指标来表示当前运行的状态。

1.2 进程和程序的区别

含义
程序 程序和进程的区别 静态的概念
进程 运行起来的程序,运行结束后就销毁了,但是程序还存
放在系统中
1.程序是指令和数据的有序集合    静态的概念    永久存在的

2.进程是程序在主机上面运行的一个过程   动态的概念   会随着程序的创建,运行,终止,消除而终止    临时

1.3 进程的生命周期

每一个进程都有其生命周期,例如创建、运行、终止和消除。这些阶段会在系统启动和运行中重复无数次。因此,进程的生命周期对于其性能的分析是非常重要的。

1.4 进程的运行过程

用户运行了一个程序,系统会给进程分配任务,进程会通过fork一个子进程,子进程会继承父进程的衣钵,子进程处理具体的任务,父进程就会进入等待状态,子进程任务结束,回来向父进程交任务,子进程正常退出

子进程在执行任务时,父进程因为意外原因退出了,那么子进程就会变成无人管理,就是僵尸进程

每个进程都有自己的代号  ID号  子进程  PID   父进程  PPID

二. 静态显示进程状态-ps

2.1 含义

ps命令来自于英文词组”process status“的缩写,其功能是用于显示当前系统的进程状态。使用ps命令可以查看到进程的所有信息,例如进程的号码、发起者、系统资源使用占比(处理器与内存)、运行状态等等。帮助我们及时的发现哪些进程出现”僵死“或”不可中断“等异常情况。

经常会与kill命令搭配使用来中断和删除不必要的服务进程,避免服务器的资源浪费。

语法格式:ps [参数]

2.2 常用参数

a 显示现行终端机下的所有程序,包括其他用户的程序
-A 显示所有程序
c 显示每个程序真正的指令名称,而不包含路径
-C <指令名称> 指定执行指令的名称,并列出该指令的程序的状况
-d 显示所有程序,但不包括阶段作业管理员的程序
-e 显示所有进程
e 列出程序时,显示每个程序所使用的环境变量
-f 显示UID,PPIP,C与STIME栏位
-ef 显示所有的进程及进程的PPID
f 用ASCII字符显示树状结构,表达程序间的相互关系
g 显示现行终端机下的所有程序,包括所属组的程序
-G <群组识别码> 列出属于该群组的程序的状况
h 不显示标题列
-H 显示树状结构,表示程序间的相互关系
-j 采用工作控制的格式显示程序状况
-l 采用详细的格式来显示程序状况
L 列出栏位的相关信息
-m 显示所有的执行绪
n 以数字来表示USER和WCHAN栏位
-N 显示所有的程序,除了执行ps指令终端机下的程序之外
-p <程序识别码> 指定程序识别码,并列出该程序的状况
r 只列出现行终端机正在执行中的程序
-s <阶段作业> 列出隶属该阶段作业的程序的状况
s 采用程序信号的格式显示程序状况
S 列出程序时,包括已中断的子程序资料
-t <终端机编号> 列出属于该终端机的程序的状况
-T 显示现行终端机下的所有程序
u 显示有效的用户或者uid
-U <用户识别码> 列出属于该用户的程序的状况
U <用户名称> 列出属于该用户的程序的状况
v 采用虚拟内存的格式显示程序状况
-V或V 显示版本信息
-w或w 采用宽阔的格式来显示程序状况
x 显示所有程序,不以终端机来区分
X 采用旧式的Linux i386登陆格式显示程序状况
-y 配合选项”-l”使用时,不显示F(flag)栏位,并以RSS栏位取代ADDR栏位
--cols <每列字符数> 设置每列的最大字符数
--headers 重复显示标题列
--help 在线帮助
--info 显示排错信息
--lines <显示列数> 设置显示画面的列数
aux 查看进程用户、PID、占用CPU百分比、占用内存百分比、状态、执行的命令等

2.3 使用案例

  • 显示系统中全部的进程信息,含详细信息
STAT基本状
描述 STAT状
态+符号
描述
R(running) 进程运行 s 进程是控制进程, Ss进程的
领导者,父进程
S 可中断进程(可随时停止) < 进程运行在高优先级上,S<
优先级较高的进程
T(terminate) 进程被暂停(挂起) N 进程运行在低优先级上,SN
优先级较低的进程
D 不可中断进程(IO) + 当前进程运行在前台,R+该
表示进程在前台运行
Z 僵尸进程 l(小写L) 进程是多线程的,Sl表示进
程是以线程方式运行
[root@jindada ~]# ps  aux
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
root 1 0.0 0.1 125420 2112 ? Ss Aug03 0:03 /usr/lib/systemd/systemd --switched-root --system --des
root 2 0.0 0.0 0 0 ? S Aug03 0:00 [kthreadd]
root 3 0.0 0.0 0 0 ? S Aug03 0:00 [ksoftirqd/0]
root 5 0.0 0.0 0 0 ? S< Aug03 0:00 [kworker/0:0H]
root 7 0.0 0.0 0 0 ? S Aug03 0:00 [migration/0]
root 8 0.0 0.0 0 0 ? S Aug03 0:00 [rcu_bh]
root 9 0.0 0.0 0 0 ? R Aug03 0:07 [rcu_sched]
root 10 0.0 0.0 0 0 ? S< Aug03 0:00 [lru-add-drain]
root 11 0.0 0.0 0 0 ? S Aug03 0:00 [watchdog/0] USER #进程运行的身份 用户 PID #进程的ID号 PPID #父进程的ID号 %CPU #进程占用CPU的百分比 %MEM #进程占用内存的百分比 VSZ #虚拟内存集 进程占用虚拟内存的大小 RSS #物理内存集 进程占用物理内存的大小 TTY #终端 ? #没有终端 内核运行的程序 tty1 #机器的终端 服务器的本地 pts/0 #虚拟远程终端 STAT #进程的状态 S #休眠的状态 R #正在运行的状态 D #无法中断的状态 写入数据时候 是这个状态 T #暂停或被追踪的状态 Z #僵尸状态 s #父进程 < #优先级高 N #优先级低 l #多线程 + #在前台运行 Ss #控制进程, 父进程 START #进程的启动时间 TIME #进程占用CPU的时间 COMMAND #执行的指令或者命令 [] #内核运行的 无[] #用户运行的 [root@jindada ~]# ps -ef
UID PID PPID C STIME TTY TIME CMD
root 1 0 0 Aug03 ? 00:00:03 /usr/lib/systemd/systemd --switched-root --system --deserialize 22
root 2 0 0 Aug03 ? 00:00:00 [kthreadd]
root 3 2 0 Aug03 ? 00:00:00 [ksoftirqd/0]
root 5 2 0 Aug03 ? 00:00:00 [kworker/0:0H]
root 7 2 0 Aug03 ? 00:00:00 [migration/0]
root 8 2 0 Aug03 ? 00:00:00 [rcu_bh]
root 9 2 0 Aug03 ? 00:00:07 [rcu_sched]
root 10 2 0 Aug03 ? 00:00:00 [lru-add-drain]
  • 命令总结
ps 命令总结
#ps ※※※※※
- ps aux 查看所有进程详细信息 (静态)
- ps auxf 查看所有进程详细信息 (静态)(f 树状显示)
- ps axo 查看指定的信息,(ps axo %mem,%cpu,sata)
- ps aux --sort -%mem (对于mem内存使用率 进行排序,-大到小)
- ps ef 查看所有进程信息 包括父进程
  • 结合管道操作符,将当前系统运行状态中指定进程信息过滤出来
#案例一
#01 打开一个窗口执行
[root@master01 ~]# tail -f /etc/passwd #另外一个窗口 #02 取出 tail 进程信息
[root@master01 ~]# ps -aux | grep [t]ail
root 16415 0.0 0.0 108092 612 pts/1 S+ 23:06 0:00 tail -f /etc/passwd #03 放入后台
[root@master01 ~]# tail -f /etc/passwd
dbus:x:81:81:System message bus:/:/sbin/nologin
polkitd:x:999:998:User for polkitd:/:/sbin/nologin
sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin
postfix:x:89:89::/var/spool/postfix:/sbin/nologin
apache:x:48:48:Apache:/usr/share/httpd:/sbin/nologin
rpc:x:32:32:Rpcbind Daemon:/var/lib/rpcbind:/sbin/nologin
rpcuser:x:29:29:RPC Service User:/var/lib/nfs:/sbin/nologin
nfsnobody:x:65534:65534:Anonymous NFS User:/var/lib/nfs:/sbin/nologin
ntp:x:38:38::/etc/ntp:/sbin/nologin
nginx:x:998:996:Nginx web server:/var/lib/nginx:/sbin/nologin ^Z
[1]+ 已停止 tail -f /etc/passwd #04 再次检查tail 进程信息
[root@master01 ~]# ps -aux | grep [t]ail
root 16415 0.0 0.0 108092 612 pts/1 T 23:06 0:00 tail -f /etc/passwd ###案例二
#01 打包命令
[root@jindada ~]# tar czf etc.tar.gz /usr /etc/ /var
tar: Removing leading `/' from member names
tar: Removing leading `/' from hard link targets #02 检查进程信息
[root@master01 ~]# ps -auxf | grep tar
root 17095 22.5 0.0 124796 2268 pts/3 R+ 23:18 0:04 \_ tar czf etc.tar.gz /usr /etc/ /var
[root@master01 ~]# ps -auxf | grep [t]ar
root 17095 20.3 0.0 124796 2268 pts/3 D+ 23:18 0:05 \_ tar czf etc.tar.gz /usr /etc/ /var
[root@master01 ~]# ps -auxf | grep [t]ar
root 17095 21.9 0.0 125844 3360 pts/3 D+ 23:18 0:09 \_ tar czf etc.tar.gz /usr /etc/ /var
[root@master01 ~]# ps -auxf | grep [t]ar
root 17095 21.8 0.0 126132 3624 pts/3 R+ 23:18 0:10 \_ tar czf etc.tar.gz /usr /etc/ /var
[root@master01 ~]# ps -auxf | grep [t]ar
root 17095 21.9 0.0 126364 3940 pts/3 R+ 23:18 0:10 \_ tar czf etc.tar.gz /usr /etc/ /var
[root@master01 ~]# ps -auxf | grep [t]ar
root 17095 22.3 0.0 126364 3940 pts/3 R+ 23:18 0:10 \_ tar czf etc.tar.gz /usr /etc/ /var
[root@master01 ~]# ps -auxf | grep [t]ar
root 17095 22.3 0.0 126496 3940 pts/3 R+ 23:18 0:10 \_ tar czf etc.tar.gz /usr /etc/ /var
[root@master01 ~]# ps -auxf | grep [t]ar 解释下: R+ 前台运行的进程
D+ 正在写数据 无法中断的状态
  • 结合管道操作符,将当前系统运行状态中指定用户的进程信息过滤出来
[root@jindada ~]# ps -u root
PID TTY TIME CMD
1 ? 00:00:01 systemd
2 ? 00:00:00 kthreadd
3 ? 00:00:00 rcu_gp
4 ? 00:00:00 rcu_par_gp
………………省略部分输出信息………………
  • 结合管道操作符与sort命令,依据cpu使用量(第三列)情况降序排序
[root@jindada ~]# ps aux | sort -rnk 3
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
root 2341 0.4 8.1 4504040 164896 tty2 Sl+ 20:05 0:24 /usr/bin/gnome-shell
root 4534 0.3 0.4 220064 8520 ? Ssl 21:37 0:00 /usr/libexec/nm-dispatcher
gdm 1541 0.1 7.3 4211428 147400 tty1 Sl+ 20:05 0:06 /usr/bin/gnome-shell ………………省略部分输出信息………………
  • 结合管道操作符与sort命令,依据内存使用量(第四列)情况降序排序
[root@jindada ~]# ps aux | sort -rnk 4
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
root 2341 0.4 8.1 4503976 164828 tty2 Sl+ 20:05 0:27 /usr/bin/gnome-shell
gdm 1541 0.1 7.3 4211428 147556 tty1 Sl+ 20:05 0:08 /usr/bin/gnome-shell
root 2661 0.0 3.1 1271636 63004 tty2 Sl+ 20:05 0:01 /usr/bin/gnome-software --gapplication-service
………………省略部分输出信息………………
  • 虚拟内存使用量进行排序
[root@master01 ~]# ps  -aux | sort | sort -k 5 -rn | head
polkitd 686 0.0 0.3 612348 12268 ? Ssl 16:49 0:00 /usr/lib/polkit-1/polkitd --no-debug
root 963 0.0 0.4 574296 17444 ? Ssl 16:50 0:03 /usr/bin/python2 -Es /usr/sbin/tuned -l -P
root 692 0.0 0.2 474792 8816 ? Ssl 16:49 0:01 /usr/sbin/NetworkManager --no-daemon
root 699 0.1 0.1 305500 6596 ? Ssl 16:49 0:27 /usr/bin/vmtoolsd
root 966 0.0 0.1 222764 4992 ? Ssl 16:50 0:02 /usr/sbin/rsyslogd -n
root 707 0.0 0.0 195204 2044 ? Ssl 16:49 0:00 /usr/sbin/gssproxy -D
root 513 0.0 0.0 190376 1348 ? Ss 16:49 0:00 /usr/sbin/lvmetad -f
root 15150 0.0 0.1 161536 6072 ? Ss 22:18 0:00 sshd: root@pts/0
root 16377 0.0 0.1 159404 6020 ? Ss 23:06 0:00 sshd: root@pts/1
root 15297 0.0 0.1 159404 6024 ? Ss 22:45 0:00 sshd: root@pts/2

三、动态显示进程状态-top

3.1 含义

top命令的功能是用于实时显示系统运行状态,包含处理器、内存、服务、进程等重要资源信息。运维工程师们常常会把top命令比作是“加强版的Windows任务管理器”,因为除了能看到常规的服务进程信息以外,还能够对处理器和内存的负载情况一目了然,实时感知系统全局的运行状态,非常适合作为接手服务器后执行的第一条命令。

语法格式:top [参数]

3.2 常用参数

-d <秒> 改变显示的更新速度
-c 切换显示模式
-s 安全模式,不允许交互式指令
-i 不显示任何闲置或僵死的行程
-n 设定显示的总次数,完成后将会自动退出
-b 批处理模式,不进行交互式显示

3.3 默认格式含义

1) 示例信息

[root@jindada ~]# top
top - 09:33:58 up 23:31, 2 users, load average: 0.24, 0.10, 0.07
Tasks: 113 total, 1 running, 112 sleeping, 0 stopped, 0 zombie
%Cpu(s): 0.0 us, 0.0 sy, 0.0 ni,100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem : 2028088 total, 155648 free, 363844 used, 1508596 buff/cache
KiB Swap: 2097148 total, 2069756 free, 27392 used. 974036 avail Mem PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

2) 第一行表示含义

# 第一行表示含义:
top - 09:33:58 up 23:31, 2 users, load average: 0.24, 0.10, 0.07 09:33:58 #当前系统时间 up 23:31 #系统运行时间 2 users #登录用户的数量 连接终端的数量 load average: 0.24, 0.10, 0.07 #系统平均负载时间 1 5 15 分钟的平均负载 #查看cpu 信息
[root@master01 ~]# lscpu

3) 第二行表示含义

# 第二行表示含义:
Tasks: 113 total, 1 running, 112 sleeping, 0 stopped, 0 zombie 任务: 113 total, #总共有113个任务 1 running #一个在运行状态 112 sleeping #112休眠状态 0 stopped #0个停止状态 0 zombie #0个在僵尸状态

4) 第三行表示含义

%Cpu(s):  0.0 us,  0.0 sy,  0.0 ni,100.0 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st 

系统各个状态所占用CPU的时间百分比  	

0.0 us		#用户态  用户所占用的CPU的时间百分比

0.0 sy		#系统态  系统所占用的CPU的时间百分比

0.0 ni		#使用优先级的程序所占用的CPU的时间百分比

100.0 id	#空闲状态所占用的CPU的时间百分比

0.0 wa		#IO等待所占用的CPU的时间百分比

0.0 hi		#硬中断所占用的CPU的时间百分比

0.0 si		#软中断所占用的CPU的时间百分比

0.0 st		#宿主机的监控程序所窃取的虚拟机的CPU的时间百分比

5) 第四行表示含义

KiB Mem :  2028088 total,   155648 free,   363844 used,  1508596 buff/cache

物理内存     总的 				剩余的        已使用的       缓存和缓冲中的内存

6) 第五行表示含义

KiB Swap:  2097148 total,  2069756 free,    27392 used.   974036 avail Mem 

虚拟内存:
PID #进程的ID号 USER #运行的身份 用户 PR #优先级 20 NI #nice值 跟PR 相差 20个数 值越低,优先级就越高 VIRT #所占用的虚拟内存的大小 RES #所占用的物理内存的大小 SHR #共享内存 S #进程的状态 %CPU #占用CPU的百分比 %MEM #占用内存的百分比 TIME+ #CPU的运行时间 COMMAND #运行的指令或者命令

3.4 top的内部指令

h     #查看帮出

z     #高亮显示

1     #显示所有CPU的负载 阿拉伯数字

s     #设置刷新时间

b     #高亮显示处于R状态的进程

M     #按内存使用百分比排序输出

P     #按CPU使用百分比排序输出

R     #对排序进行反转

f     #自定义显示字段

k     #kill掉指定PID进程

W     #保存top环境设置 ~/.toprc 

q     #退出

3.5 常见示例

#01 以默认格式显示系统运行信息,但提供完整的进程路径及名称
[root@jindada ~]# top -c #02 以批处理模式显示程序信息
[root@jindada ~]# top -b #03 设定每隔5秒刷新一次信息
[root@jindada ~]# top -d 5 #04 查看某个进程ID的进程状态
[root@jindada ~]# top -d 1 -p 1 #05 显示指定运行用户的进程状态
[root@jindada ~]# top -d 1 -u root #06 设定总显示次数为3回,随后自动退出命令
[root@jindada ~]# top -n 5 #07 top静态输出
[root@master01 ~]# top -n 1
top - 00:27:23 up 7:37, 5 users, load average: 0.00, 0.01, 0.05
Tasks: 140 total, 1 running, 138 sleeping, 1 stopped, 0 zombie
%Cpu(s): 3.0 us, 0.0 sy, 0.0 ni, 97.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem : 4026160 total, 1037120 free, 195160 used, 2793880 buff/cache
KiB Swap: 4063228 total, 4063228 free, 0 used. 3533804 avail Mem
## 4.1 互动的进程查看器-htop

````sh

#01 定义
htop是linux系统中的一个互动的进程查看器,一个文本模式的应用程序(在控制台或者X终端中),需要ncurses。htop比较人性化。它可让用户交互式操作,支持颜色主题,可横向或纵向滚动浏览进程列表,并支持鼠标操作。 htop相比较top的优势有可以横向或纵向滚动浏览进程列表,以便看到所有的进程和完整的命令行、在启动上比top更快、杀进程时不需要输入进程号、支持鼠标选中操作、top已不再维护。

4.2 安装

[root@jindada ~]# yum install  -y  htop

4.3 常用参数

-C 使用单色配色方案
-d 设置更新的延迟, 单位是10微秒
-s 纵列排序
-u 只显示一个指定用户的进程
-p 只显示给用户
-h 打印此命令帮助
-v 打印版本信息

4.4 交互式命令

space 标记一个进程
U 取消所有标记
l 显示进程打来的文件
u 显示特定用户
M 按照内存排序
P 按照CPU排序
T 按在线时长排序
直接输入数字 查找对应的PID进程

4.5 常见示例

#01 启动htop
[root@jindada ~]# htop #02 以单色模式启动htop
[root@jindada ~]# htop -C #03 设置显示更新的延迟为3秒
[root@jindada ~]# htop -d 3 #04 显示一个给定的用户的进程
[root@jindada ~]# htop -u jhno1

五.高层次的多子系统概览-glances

5.1 含义

Linux系统自带了很多系统性能监控工具,如top,vmstat,iftop等等,还有一款监视工具glances,它能把其他几个监控的指标都集于一身。Glances是一个相对比较新的系统监控工具,用 Python 编写的,使用 psutil 库从系统获取信息。可以用它来监控 CPU、平均负载、内存、网络接口、磁盘 I/O,文件系统空间利用率、挂载的设备、所有活动进程以及消耗资源最多的进程。Glances 有很多有趣的选项。它的主要特性之一是可以在配置文件中设置阀值(careful小心、warning警告、critical致命),然后它会用不同颜色显示信息以表明系统的瓶颈。

语法格式:glances [参数]

2.安装

#安装
yum install epel-release -y
yum install glances -y

3.常用参数

-b 显示网络连接速度 Byte/ 秒
-s 设置 glances 运行模式为服务器
-B 绑定服务器端 IP 地址或者主机名称
-c 连接 glances 服务器端
-t 设置屏幕刷新的时间间隔,单位为秒,默认值为 2 秒,数值许可范围:1~32767

4.常见示例

#### 192.168.5.15  主机启动 glances 服务

#01 启动服务
[root@node01 ~]# glances -s -B 10.0.0.101 &
[1] 3648 #02 从另一台主机查看 172.17.0.15 主机的系统负载状态
[root@jindada ~]# glances -c 192.168.5.15 #03 显示网络连接速度 Byte/ 秒
[root@jindada ~]# glances -b #04 设置屏幕刷新的时间间隔为6秒
[root@jindada ~]# glances -t 6

六.进程杀手三剑客

6.1 pid杀手-kill

1. 含义

kill命令的功能是用于杀死(结束)进程,与英文单词的含义相同。Linux系统中如需结束某个进程,既可以使用如service或systemctl的管理命令来结束服务,也可以使用kill命令直接结束进程信息。

如使用kill命令后进程并没有被结束,则可以使用信号9进行强制杀死动作。

语法格式:kill [参数] 进程号

2. 常用参数

-l 列出系统支持的信号
-s 指定向进程发送的信号
-a 不限制命令名和进程号的对应关系
-p 不发送任何信号
-9 强制

3. 常见示例

  • 列出当前系统所支持的信号
[root@jindada ~]# kill  -l
1) SIGHUP 2) SIGINT 3) SIGQUIT 4) SIGILL 5) SIGTRAP
6) SIGABRT 7) SIGBUS 8) SIGFPE 9) SIGKILL 10) SIGUSR1
11) SIGSEGV 12) SIGUSR2 13) SIGPIPE 14) SIGALRM 15) SIGTERM
16) SIGSTKFLT 17) SIGCHLD 18) SIGCONT 19) SIGSTOP 20) SIGTSTP
21) SIGTTIN 22) SIGTTOU 23) SIGURG 24) SIGXCPU 25) SIGXFSZ
26) SIGVTALRM 27) SIGPROF 28) SIGWINCH 29) SIGIO 30) SIGPWR
31) SIGSYS 34) SIGRTMIN 35) SIGRTMIN+1 36) SIGRTMIN+2 37) SIGRTMIN+3
38) SIGRTMIN+4 39) SIGRTMIN+5 40) SIGRTMIN+6 41) SIGRTMIN+7 42) SIGRTMIN+8
43) SIGRTMIN+9 44) SIGRTMIN+10 45) SIGRTMIN+11 46) SIGRTMIN+12 47) SIGRTMIN+13
48) SIGRTMIN+14 49) SIGRTMIN+15 50) SIGRTMAX-14 51) SIGRTMAX-13 52) SIGRTMAX-12
53) SIGRTMAX-11 54) SIGRTMAX-10 55) SIGRTMAX-9 56) SIGRTMAX-8 57) SIGRTMAX-7
58) SIGRTMAX-6 59) SIGRTMAX-5 60) SIGRTMAX-4 61) SIGRTMAX-3 62) SIGRTMAX-2
63) SIGRTMAX-1 64) SIGRTMAX #记住以下即可 1 #重新加载配置 进程pid的不变 2 #终止信号 ctrl + c 9 #终止进程 强制终止 15 #默认信号 终止进程 可加可不加 18 #让暂停的进程继续运行 20 #ctrl + z 将进程暂停
  • 强制结束某个指定的进程(数字为对应的PID值)
### 如果kill 没杀死 可以使用该参数强行终止 ####重点##
[root@jindada ~]# kill -9 13063 #01 开启top窗口
[root@jindada ~]# top
[root@jindada ~]# ps aux |grep [t]op
root 13115 0.0 0.1 161988 2212 pts/1 S+ 10:41 0:00 top #02 后台终止
[root@jindada ~]# kill -2 13115
[root@jindada ~]# ps aux |grep [t]op
  • 结束某个指定的进程(数字为对应的PID值)
#01 结束进程
[root@jindada ~]# kill 13141
[root@jindada ~]# ps aux |grep [t]op
root 13144 0.0 0.1 161984 2212 pts/1 S+ 10:44 0:00 top #02 默认是15
[root@jindada ~]# kill -15 13144

6.2 名称杀手-killall

1.含义

killall命令使用进程的名称来杀死进程,使用此指令可以杀死一组同名进程。我们可以使用kill命令杀死指定进程PID的进程,如果要找到我们需要杀死的进程,我们还需要在之前使用ps等命令再配合grep来查找进程,而killall把这两个过程合二为一,是一个很好用的命令。

我们可以使用kill命令杀死指定进程PID的进程,如果要找到我们需要杀死的进程,我们还需要在之前使用ps等命令再配合grep来查找进程,而killall把这两个过程合二为一,是一个很好用的命令。

语法格式:killall [参数]

2.常用参数

-e 对长名称进行精确匹配
-l 打印所有已知信号列表
-p 杀死进程所属的进程组
-i 交互式杀死进程,杀死进程前需要进行确认
-r 使用正规表达式匹配要杀死的进程名称
-s 用指定的进程号代替默认信号“SIGTERM”
-u 杀死指定用户的进程

3.常见示例

  • 杀死httpd所有进程
[root@jindada ~]# killall -9 httpd
  • 使用-l参数打印所有已知信号列表
[root@jindada ~]# killall -l
  • 根据名称终止进程,精确匹配
kill		#根据进程ID去终止进程的   进程不存在时,会进行提示
[root@jindada ~]# killall top [root@jindada ~]# killall nginx [root@jindada ~]# killall nginx #进程不存在时,会提示
nginx: no process found [root@jindada ~]# ps aux | grep [v]im
root 13264 0.0 0.2 149168 4972 pts/0 S+ 10:53 0:00 vim 123.txt
root 13265 0.1 0.2 149168 4972 pts/1 S+ 10:53 0:00 vim 123.log
[root@jindada ~]# killall vim

6.3 进程杀手-pkill

1.含义

pkill命令来自于英文词组“process kill”的缩写,其功能是依据进程名杀死指定进程。pkill命令与kill、killall十分相似,都是用于杀死(结束)指定进程的命令。

*获取进程名称可使用ps命令,获取进程号码可使用pidof命令。

语法格式:pkill [参数] 进程名

2.常用参数

-P 指定父进程号
-g 指定进程组
-t 指定开启进程的终端

3.常见示例

  • 杀死指定名称的进程
pkill		#根据进程名称终止   终止进程不会提示    模糊杀手   

[root@jindada ~]# ps  aux | grep  [t]op
root 13278 0.0 0.1 161988 2216 pts/0 S+ 10:56 0:00 top
root 13279 0.1 0.1 122396 2112 pts/1 S+ 10:56 0:00 htop
[root@jindada ~]# pkill top
[root@jindada ~]# ps aux | grep [t]op
[root@jindada ~]# [root@jindada ~]# ps aux |grep sh
root 6935 0.0 0.0 112756 1276 ? Ss Aug03 0:00 /usr/sbin/sshd -D
root 7191 0.0 0.0 161364 1616 ? Ss Aug03 0:00 sshd: root@pts/0
root 7193 0.0 5.4 225028 111168 pts/0 Ss+ Aug03 0:05 -bash
root 12573 0.0 0.2 161364 5936 ? Ss 09:04 0:00 sshd: root@pts/1
root 12575 0.0 0.1 115572 2196 pts/1 Ss 09:04 0:00 -bash
root 13215 0.0 0.2 161364 6056 ? Ss 10:50 0:00 sshd: root@pts/2
root 13217 0.0 0.1 115572 2184 pts/2 Ss 10:50 0:00 -bash
root 13296 0.0 0.0 113176 1196 pts/2 S+ 10:59 0:00 sh 123.txt
root 13299 0.0 0.0 113176 1216 ? Ss 10:59 0:00 /bin/sh -c /usr/sbin/ntpdate ntp.aliyun.com &>/dev/null
root 13302 0.0 0.0 112708 976 pts/1 R+ 10:59 0:00 grep --color=auto sh
[root@jindada ~]# pkill sh
  • 踢出用户终端登入
#01 [root@aliyun ~]# w
13:35:21 up 572 days, 22:40, 3 users, load average: 0.01, 0.04, 0.05
USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
root pts/0 222.128.101.253 11:30 1:57m 0.03s 0.03s -bash
root pts/1 222.128.101.253 12:21 1:10m 0.98s 0.03s -bash
root pts/2 222.128.101.253 13:24 1.00s 0.03s 0.00s w #02 强制杀死从pts/1虚拟终端登陆的进程
[root@aliyun ~]# pkill -9 -t pts/1

七. 以树状图显示进程-pstree

7.1 含义

Linux系统中pstree命令的英文全称是“process tree”,即将所有行程以树状图显示,树状图将会以 pid (如果有指定) 或是以 init 这个基本行程为根 (root),如果有指定使用者 id,则树状图会只显示该使用者所拥有的行程。

语法格式: pstree [参数]

7.2 常用参数

-a 显示每个程序的完整指令,包含路径,参数或是常驻服务的标示
-c 不使用精简标示法
-G 使用VT100终端机的列绘图字符
-h 列出树状图时,特别标明现在执行的程序

7.3 常见示例

#01 显示当前所有进程的进程号和进程id
[root@jindada ~]# pstree -p #02 显示所有进程的所有详细信息,遇到相同的进程名可以压缩显示
[root@jindada ~]# pstree -a #03 以树形结构显示进程状态
[root@jindada ~]# pstree
systemd─┬─NetworkManager───2*[{NetworkManager}]
├─VGAuthService
├─auditd───{auditd}
├─crond───crond───sh───ntpdate
├─dbus-daemon
├─firewalld───{firewalld}
├─login───bash
├─master─┬─pickup
│ └─qmgr
├─ping
├─polkitd───6*[{polkitd}]
├─rsyslogd───2*[{rsyslogd}]
├─sshd───sshd───bash───pstree
├─systemd-journal
├─systemd-logind
├─systemd-udevd
├─tuned───4*[{tuned}]
├─vmtoolsd
└─vsftpd

八. 管理后台的进程-screen

8.1 什么是后台进程

通常进程都会在终端前台运行,但是一旦关闭终端,进程也会随着结束,那么此时我们就希望进程能在后台运行,就是将在前台运行的进程放到后台运行,这样即使我们关闭了终端也不影响进程的正常运行。

8.2 为什么把进程放后台

企业中很多时候会有一些需求:

比如:我们此前在国内服务器往国外服务器传输大文件时,由于网络问题需要传输很久,如果在传输的过程中出现网络抖动或者不小心关闭了终端则会导致传输失败,如果能将传输的进程放入后台,是不是就能解决此类问题了。

8.3 进程放到后台

 早期的时候,大家都选择使用 & 符号将进程放到后台运行,然后再使用jobs、bg、fg等方式查看进程状态,但太麻烦了,也不直观,所以我们推荐使用screen。

8.4 jobs、fg

## 命令放入后台执行
[root@jindada ~]# sleep 3000 & #运行程序(时),让其在后台执行 # ctrt+z ,将前台的程序挂起(暂停)到后台
[root@jindada ~]# sleep 4000 #^Z,将前台的程序挂起(暂停)到后台 [2]+ Stopped sleep 4000
[root@jindada ~]# ps aux |grep sleep
[root@jindada ~]# jobs #查看后台作业
[1]- Running sleep 3000 &
[2]+ Stopped sleep 4000 [root@jindada ~]# fg %1 #将作业 1 调回到前台
[root@jindada ~]# kill %1 #kill 1,终止 PID 为 1 的进程 #进程在后台运行,但输出依然在当前终端 [root@jindada ~]# (while :; do date; sleep 2; done) & [root@jindada ~]# (while :; do date; sleep 2; done) &>/dev/null &

8.5 screen的使用

  • 强烈推荐,生产必用

1. 含义

    screen命令为多重视窗管理程序。此处所谓的视窗,是指一个全屏幕的文字模式画面。通常中有在使用telnet登入主机或是使用老式的终端机时,才有可能用到screen程序。

语法格式:screen [参数]

2. 安装

[root@jindada ~]# yum install screen -y

3. 常用参数

-A 将所有的视窗都调整为目前终端机的大小
-d<作业名称> 将指定的screen作业离线
-m 即使目前已在作业中的screen作业,仍强制建立新的screen作业
-r<作业名称> 恢复离线的screen作业
-R 先试图恢复离线的作业,若找不到离线的作业,即建立新的screen作业
-s 指定建立新视窗时,所要执行的shell
-S<作业名称> 指定screen作业的名称
-v 显示版本信息
-x 恢复之前离线的screen作业
-ls 显示目前所有的screen作业
-list 显示目前所有的screen作业
-wipe 检查目前所有的screen作业,并删除已经无法使用的screen作业

4. 常见示例

  • 创建screen终端
[root@jindada ~]# screen
  • 开启一个screen窗口,指定名称
#1.开启一个screen窗口,指定名称
[root@jindada ~]# screen -S wget_mysql #2.在screen窗口中执行任务即可。 #3.平滑的退出screen,但不会终止screen中的任务。
ctrl+a+d #04 使用exit关闭screen窗口
exit
  • 查看当前正在运行的screen有哪些
[root@jindada ~]# screen -list
There is a screen on:
22058.wget_mysql (Detached)
1 Socket in /var/run/screen/S-root.
  • 进入正在运行的screen
[root@jindada ~]# screen -r wget_mysql
[root@jindada ~]# screen -r 22058
  • 创建screen终端并执行任务
[root@jindada ~]# screen vi ~/main.c
  • 重新连接id为2276的screen终端
[root@jindada ~]# screen -r 2276
  • 显示已创建的screen终端
[root@jindada ~]# screen ls
  • 将wget_mysql作业离线
[root@jindada ~]# screen -d wget_mysql

6.具体小案例

#列出screen后台运行的程序

[root@jindada ~]# screen   -list
No Sockets found in /var/run/screen/S-root. [root@jindada ~]# [root@jindada ~]# screen -S vim #打开一个新的窗口 并指定窗口名称
[detached from 13659.vim] [root@jindada ~]# screen -list
There is a screen on:
13659.vim (Detached)
1 Socket in /var/run/screen/S-root. [root@jindada ~]# screen -r vim #或者通过id号 [root@jindada ~]# screen -xr vim #实时监控窗口的操作 [detached from 13659.vim] ctrl + a + d #临时退出 exit #真正退出

九. 后端运行程序-nohup

9.1 含义

nohup命令来自于英文词组“no hang up”的缩写,其功能是用于后端运行程序。nohup命令可以将程序以忽略挂起信号的方式运行起来,而被运行程序的输出信息不会显示到屏幕上。

语法格式:nohup [参数]

9.2 常用参数

--help 在线帮助
--version 显示版本信息

9.3 常见示例

以后端模式运行指定脚本程序

[root@jindada ~]# nohup linux.sh &

以后端模式执行指定命令,并将输出结果写入到文件

[root@jindada ~]# nohup uptime &> system.txt

9.4 具体小案例

#01 默认的 放入后台 并把输出结果追加到 nohup.out文件内
[root@jindada ~]# nohup ping www.baidu.com &
[1] 13517
[root@jindada ~]# nohup: ignoring input and appending output to ‘nohup.out’ #02 把程序放入后台 并把输出追加到 指定文件内
^C[root@master01 ~]# nohup ping www.baidu.com &>/tmp/zhang.log &
[2] 46334
[root@master01 ~]# tail -f /tmp/zhang.log
64 bytes from 110.242.68.3 (110.242.68.3): icmp_seq=61 ttl=128 time=16.5 ms
64 bytes from 110.242.68.3 (110.242.68.3): icmp_seq=62 ttl=128 time=29.6 ms
64 bytes from 110.242.68.3 (110.242.68.3): icmp_seq=63 ttl=128 time=17.7 ms
64 bytes from 110.242.68.3 (110.242.68.3): icmp_seq=64 ttl=128 time=14.6 ms
64 bytes from 110.242.68.3 (110.242.68.3): icmp_seq=65 ttl=128 time=20.7 ms
64 bytes from 110.242.68.3 (110.242.68.3): icmp_seq=66 ttl=128 time=56.2 ms
64 bytes from 110.242.68.3 (110.242.68.3): icmp_seq=67 ttl=128 time=43.2 ms
64 bytes from 110.242.68.3 (110.242.68.3): icmp_seq=68 ttl=128 time=15.5 ms
64 bytes from 110.242.68.3 (110.242.68.3): icmp_seq=69 ttl=128 time=15.1 ms
64 bytes from 110.242.68.3 (110.242.68.3): icmp_seq=70 ttl=128 time=14.0 ms
64 bytes from 110.242.68.3 (110.242.68.3): icmp_seq=71 ttl=128 time=19.1 ms 解释下:
&> 混合重定向 正确和错误信息全部输出到文件内 infO 正常
error 错误 #02 #将后台程序放入到前台运行
[root@jindada ~]# fg %2 #将暂停在后台的程序继续在后台运行 输出还是输出到屏幕上面 #03 终止后台进程
[root@master01 ~]# jobs
[1] 运行中 nohup ping www.baidu.com &
[2] 运行中 nohup ping www.baidu.com &>/tmp/zhang.log &
[3]- 运行中 nohup ping www.baidu.com &>/dev/null &
[4]+ 运行中 nohup ping www.baidu.com 1 &
[root@master01 ~]# kill %1
[root@master01 ~]# kill %2
[1] 已终止 nohup ping www.baidu.com
[root@master01 ~]# kill %3
[2] 已终止 nohup ping www.baidu.com &>/tmp/zhang.log
[root@master01 ~]# kill %4
[3]- 已终止 nohup ping www.baidu.com &>/dev/null
[root@master01 ~]# jobs
[4]+ 已终止 nohup ping www.baidu.com 1

十. 系统平均负载

1.系统平均负载-top

[root@jindada ~]# top
top - 11:54:48 up 1 day, 1:52, 3 users, load average: 0.00, 0.01, 0.05

2.系统平均负载-w

[root@jindada ~]# w
11:54:59 up 1 day, 1:52, 3 users, load average: 0.00, 0.01, 0.05

3.系统平均负载-uptime

3.1 含义

Linux系统中的uptime命令主要用于获取主机运行时间和查询Linux系统负载等信息。

uptime命令可以显示系统已经运行了多长时间,信息显示依次为:现在时间、系统已经运行了多长时间、目前有多少登录用户、系统在过去的1分钟、5分钟和15分钟内的平均负载。 uptime命令用法十分简单,直接输入uptime即可查看系统负载情况。

语法格式:uptime [参数]

3.2 常用参数

-p 以漂亮的格式显示机器正常运行的时间
-s 系统自开始运行时间,格式为yyyy-mm-dd hh:mm:ss
-h 显示帮助信息

3.3 常见示例

显示当前系统运行负载情况

[root@jindada ~]# uptime
11:55:09 up 1 day, 1:53, 3 users, load average: 0.00, 0.01, 0.05

使用-p参数显示机器正常运行的时间

[root@jindada ~]# uptime -p
up 2 days, 5 hours, 15 minutes

使用-s参数显示机器启动时间

[root@jindada ~]# uptime -s
2019-05-09 10:09:43

4.系统平均负载问题

1分钟    5分钟    15分钟   系统的平均负载 

平均负载跟系统CPU的使用率没有太大关系

在单位时间内,系统正在运行中的进程数或者不可中断的进程数量   进程的活跃数量 

跟CPU的核心数有关系 

当负载为2的时候    

核心数为4       50% 

核心数为2		100% 

核心数为1       200%

当1分钟的值小于5分钟和15分钟的时候   说明你之前的平均负载过高,当前正在降低  

当1分钟跟5分钟和15分钟的值很近的时候,平均负载很稳定  

当1分钟的值大于5分钟和15分钟的时候,说明现在的负载正在慢慢的变大   

####当值达到70%   就要开始分析问题 

十一 systemd 系统管理

11.1 定义

linux 在开机加载内核后,便由内核加载 systemd init 系统,再由 systemd init 系统加载用户空间和启动进程。systemd 控制系统服务间的依赖关系,并依此实现系统初始化时服务的并行启动

11.2 系统管理

Systemd 并不是一个命令,而是一组命令,涉及到系统管理的方方面面。

1. systemctl

systemctl是 Systemd 的主命令,用于管理系统。

# 重启系统
$ sudo systemctl reboot # 关闭系统,切断电源
$ sudo systemctl poweroff # CPU停止工作
$ sudo systemctl halt # 暂停系统
$ sudo systemctl suspend # 让系统进入冬眠状态
$ sudo systemctl hibernate # 让系统进入交互式休眠状态
$ sudo systemctl hybrid-sleep # 启动进入救援状态(单用户状态)
$ sudo systemctl rescue

2. systemd-analyze

systemd-analyze命令用于查看启动耗时。

# 查看启动耗时
$ systemd-analyze # 查看每个服务的启动耗时
$ systemd-analyze blame # 显示瀑布状的启动过程流
$ systemd-analyze critical-chain # 显示指定服务的启动流
$ systemd-analyze critical-chain atd.service

3. hostnamectl

hostnamectl命令用于查看当前主机的信息。

# 显示当前主机的信息
$ hostnamectl # 设置主机名。
$ sudo hostnamectl set-hostname rhel7

4. localectl

localectl命令用于查看本地化设置。

# 查看本地化设置
$ localectl # 设置本地化参数。
$ sudo localectl set-locale LANG=en_GB.utf8
$ sudo localectl set-keymap en_GB

5. timedatectl

timedatectl命令用于查看当前时区设置。

# 查看当前时区设置
$ timedatectl # 显示所有可用的时区
$ timedatectl list-timezones # 设置当前时区
$ sudo timedatectl set-timezone America/New_York
$ sudo timedatectl set-time YYYY-MM-DD
$ sudo timedatectl set-time HH:MM:SS

6. loginctl

loginctl命令用于查看当前登录的用户。

# 列出当前session
$ loginctl list-sessions # 列出当前登录用户
$ loginctl list-users # 列出显示指定用户的信息
$ loginctl show-user ruanyf

11.3 Unit 服务管理(重要)

1. 含义

Systemd 可以管理所有系统资源。不同的资源统称为 Unit(单位)。

Unit 一共分成12种。

  • Service unit:系统服务
  • Target unit:多个 Unit 构成的一个组
  • Device Unit:硬件设备
  • Mount Unit:文件系统的挂载点
  • Automount Unit:自动挂载点
  • Path Unit:文件或路径
  • Scope Unit:不是由 Systemd 启动的外部进程
  • Slice Unit:进程组
  • Snapshot Unit:Systemd 快照,可以切回某个快照
  • Socket Unit:进程间通信的 socket
  • Swap Unit:swap 文件
  • Timer Unit:定时器

systemctl list-units命令可以查看当前系统的所有 Unit 。

# 列出正在运行的 Unit
$ systemctl list-units # 列出所有Unit,包括没有找到配置文件的或者启动失败的
$ systemctl list-units --all # 列出所有没有运行的 Unit
$ systemctl list-units --all --state=inactive # 列出所有加载失败的 Unit
$ systemctl list-units --failed # 列出所有正在运行的、类型为 service 的 Unit
$ systemctl list-units --type=service

2. Unit 的状态

systemctl status命令用于查看系统状态和单个 Unit 的状态。

# 显示系统状态
$ systemctl status # 显示单个 Unit 的状态
$ sysystemctl status bluetooth.service # 显示远程主机的某个 Unit 的状态
$ systemctl -H root@rhel7.example.com status httpd.service

除了status命令,systemctl还提供了三个查询状态的简单方法,主要供脚本内部的判断语句使用。

# 显示某个 Unit 是否正在运行
$ systemctl is-active application.service # 显示某个 Unit 是否处于启动失败状态
$ systemctl is-failed application.service # 显示某个 Unit 服务是否建立了启动链接
$ systemctl is-enabled application.service

3. Unit 管理

对于用户来说,最常用的是下面这些命令,用于启动和停止 Unit(主要是 service)。

# 立即启动一个服务
$ sudo systemctl start apache.service # 立即停止一个服务
$ sudo systemctl stop apache.service # 重启一个服务
$ sudo systemctl restart apache.service # 杀死一个服务的所有子进程
$ sudo systemctl kill apache.service # 重新加载一个服务的配置文件
$ sudo systemctl reload apache.service # 重载所有修改过的配置文件
$ sudo systemctl daemon-reload # 显示某个 Unit 的所有底层参数
$ systemctl show httpd.service # 显示某个 Unit 的指定属性的值
$ systemctl show -p CPUShares httpd.service # 设置某个 Unit 的指定属性
$ sudo systemctl set-property httpd.service CPUShares=500

4. 依赖关系

Unit 之间存在依赖关系:A 依赖于 B,就意味着 Systemd 在启动 A 的时候,同时会去启动 B。

systemctl list-dependencies命令列出一个 Unit 的所有依赖。

$ systemctl list-dependencies nginx.service

上面命令的输出结果之中,有些依赖是 Target 类型(详见下文),默认不会展开显示。如果要展开 Target,就需要使用--all参数。

$ systemctl list-dependencies --all nginx.service

11.3 Unit 的配置文件

1. 概述

每一个 Unit 都有一个配置文件,告诉 Systemd 怎么启动这个 Unit 。

Systemd 默认从目录/etc/systemd/system/读取配置文件。但是,里面存放的大部分文件都是符号链接,指向目录/usr/lib/systemd/system/,真正的配置文件存放在那个目录。

systemctl enable命令用于在上面两个目录之间,建立符号链接关系。

$ sudo systemctl enable clamd@scan.service
# 等同于
$ sudo ln -s '/usr/lib/systemd/system/clamd@scan.service' '/etc/systemd/system/multi-user.target.wants/clamd@scan.service'

如果配置文件里面设置了开机启动,systemctl enable命令相当于激活开机启动。

与之对应的,systemctl disable命令用于在两个目录之间,撤销符号链接关系,相当于撤销开机启动。

$ sudo systemctl disable clamd@scan.service

配置文件的后缀名,就是该 Unit 的种类,比如sshd.socket。如果省略,Systemd 默认后缀名为.service,所以sshd会被理解成sshd.service

2. 配置文件的状态

systemctl list-unit-files命令用于列出所有配置文件。

# 列出所有配置文件
$ systemctl list-unit-files # 列出指定类型的配置文件
$ systemctl list-unit-files --type=service

这个命令会输出一个列表。

$ systemctl list-unit-files

UNIT FILE              STATE
chronyd.service enabled
clamd@.service static
clamd@scan.service disabled

这个列表显示每个配置文件的状态,一共有四种。

  • enabled:已建立启动链接
  • disabled:没建立启动链接
  • static:该配置文件没有[Install]部分(无法执行),只能作为其他配置文件的依赖
  • masked:该配置文件被禁止建立启动链接

注意,从配置文件的状态无法看出,该 Unit 是否正在运行。这必须执行前面提到的systemctl status命令。

$ systemctl status bluetooth.service

一旦修改配置文件,就要让 SystemD 重新加载配置文件,然后重新启动,否则修改不会生效。

$ sudo systemctl daemon-reload
$ sudo systemctl restart httpd.service

3. 配置文件的格式

配置文件就是普通的文本文件,可以用文本编辑器打开。

systemctl cat命令可以查看配置文件的内容。

$ systemctl cat atd.service

[Unit]
Description=ATD daemon [Service]
Type=forking
ExecStart=/usr/bin/atd [Install]
WantedBy=multi-user.target

从上面的输出可以看到,配置文件分成几个区块。每个区块的第一行,是用方括号表示的区别名,比如[Unit]。注意,配置文件的区块名和字段名,都是大小写敏感的。

每个区块内部是一些等号连接的键值对。

[Section]
Directive1=value
Directive2=value . . .

注意,键值对的等号两侧不能有空格。

4. 配置文件的区块

[Unit]区块通常是配置文件的第一个区块,用来定义 Unit 的元数据,以及配置与其他 Unit 的关系。它的主要字段如下。

  • Description:简短描述
  • Documentation:文档地址
  • Requires:当前 Unit 依赖的其他 Unit,如果它们没有运行,当前 Unit 会启动失败
  • Wants:与当前 Unit 配合的其他 Unit,如果它们没有运行,当前 Unit 不会启动失败
  • BindsTo:与Requires类似,它指定的 Unit 如果退出,会导致当前 Unit 停止运行
  • Before:如果该字段指定的 Unit 也要启动,那么必须在当前 Unit 之后启动
  • After:如果该字段指定的 Unit 也要启动,那么必须在当前 Unit 之前启动
  • Conflicts:这里指定的 Unit 不能与当前 Unit 同时运行
  • Condition...:当前 Unit 运行必须满足的条件,否则不会运行
  • Assert...:当前 Unit 运行必须满足的条件,否则会报启动失败

[Install]通常是配置文件的最后一个区块,用来定义如何启动,以及是否开机启动。它的主要字段如下。

  • WantedBy:它的值是一个或多个 Target,当前 Unit 激活时(enable)符号链接会放入/etc/systemd/system目录下面以 Target 名 + .wants后缀构成的子目录中
  • RequiredBy:它的值是一个或多个 Target,当前 Unit 激活时,符号链接会放入/etc/systemd/system目录下面以 Target 名 + .required后缀构成的子目录中
  • Alias:当前 Unit 可用于启动的别名
  • Also:当前 Unit 激活(enable)时,会被同时激活的其他 Unit

[Service]区块用来 Service 的配置,只有 Service 类型的 Unit 才有这个区块。它的主要字段如下。

  • Type:定义启动时的进程行为。它有以下几种值。
  • Type=simple:默认值,执行ExecStart指定的命令,启动主进程
  • Type=forking:以 fork 方式从父进程创建子进程,创建后父进程会立即退出
  • Type=oneshot:一次性进程,Systemd 会等当前服务退出,再继续往下执行
  • Type=dbus:当前服务通过D-Bus启动
  • Type=notify:当前服务启动完毕,会通知Systemd,再继续往下执行
  • Type=idle:若有其他任务执行完毕,当前服务才会运行
  • ExecStart:启动当前服务的命令
  • ExecStartPre:启动当前服务之前执行的命令
  • ExecStartPost:启动当前服务之后执行的命令
  • ExecReload:重启当前服务时执行的命令
  • ExecStop:停止当前服务时执行的命令
  • ExecStopPost:停止当其服务之后执行的命令
  • RestartSec:自动重启当前服务间隔的秒数
  • Restart:定义何种情况 Systemd 会自动重启当前服务,可能的值包括always(总是重启)、on-successon-failureon-abnormalon-aborton-watchdog
  • TimeoutSec:定义 Systemd 停止当前服务之前等待的秒数
  • Environment:指定环境变量

Unit 配置文件的完整字段清单,请参考官方文档

11.4 Target

启动计算机的时候,需要启动大量的 Unit。如果每一次启动,都要一一写明本次启动需要哪些 Unit,显然非常不方便。Systemd 的解决方案就是 Target。

简单说,Target 就是一个 Unit 组,包含许多相关的 Unit 。启动某个 Target 的时候,Systemd 就会启动里面所有的 Unit。从这个意义上说,Target 这个概念类似于"状态点",启动某个 Target 就好比启动到某种状态。

传统的init启动模式里面,有 RunLevel 的概念,跟 Target 的作用很类似。不同的是,RunLevel 是互斥的,不可能多个 RunLevel 同时启动,但是多个 Target 可以同时启动。

# 查看当前系统的所有 Target
$ systemctl list-unit-files --type=target # 查看一个 Target 包含的所有 Unit
$ systemctl list-dependencies multi-user.target # 查看启动时的默认 Target
$ systemctl get-default # 设置启动时的默认 Target
$ sudo systemctl set-default multi-user.target # 切换 Target 时,默认不关闭前一个 Target 启动的进程,
# systemctl isolate 命令改变这种行为,
# 关闭前一个 Target 里面所有不属于后一个 Target 的进程
$ sudo systemctl isolate multi-user.target

Target 与 传统 RunLevel 的对应关系如下。

Traditional runlevel      New target name     Symbolically linked to...

Runlevel 0           |    runlevel0.target -> poweroff.target
Runlevel 1 | runlevel1.target -> rescue.target
Runlevel 2 | runlevel2.target -> multi-user.target
Runlevel 3 | runlevel3.target -> multi-user.target
Runlevel 4 | runlevel4.target -> multi-user.target
Runlevel 5 | runlevel5.target -> graphical.target
Runlevel 6 | runlevel6.target -> reboot.target

它与init进程的主要差别如下。

(1)默认的 RunLevel(在/etc/inittab文件设置)现在被默认的 Target 取代,位置是/etc/systemd/system/default.target,通常符号链接到graphical.target(图形界面)或者multi-user.target(多用户命令行)。

(2)启动脚本的位置,以前是/etc/init.d目录,符号链接到不同的 RunLevel 目录 (比如/etc/rc3.d/etc/rc5.d等),现在则存放在/lib/systemd/system/etc/systemd/system目录。

(3)配置文件的位置,以前init进程的配置文件是/etc/inittab,各种服务的配置文件存放在/etc/sysconfig目录。现在的配置文件主要存放在/lib/systemd目录,在/etc/systemd目录里面的修改可以覆盖原始设置。

11.5 日志管理

Systemd 统一管理所有 Unit 的启动日志。带来的好处就是,可以只用journalctl一个命令,查看所有日志(内核日志和应用日志)。日志的配置文件是/etc/systemd/journald.conf

journalctl功能强大,用法非常多。

# 查看所有日志(默认情况下 ,只保存本次启动的日志)
$ sudo journalctl # 查看内核日志(不显示应用日志)
$ sudo journalctl -k # 查看系统本次启动的日志
$ sudo journalctl -b
$ sudo journalctl -b -0 # 查看上一次启动的日志(需更改设置)
$ sudo journalctl -b -1 # 查看指定时间的日志
$ sudo journalctl --since="2012-10-30 18:17:16"
$ sudo journalctl --since "20 min ago"
$ sudo journalctl --since yesterday
$ sudo journalctl --since "2015-01-10" --until "2015-01-11 03:00"
$ sudo journalctl --since 09:00 --until "1 hour ago" # 显示尾部的最新10行日志
$ sudo journalctl -n # 显示尾部指定行数的日志
$ sudo journalctl -n 20 # 实时滚动显示最新日志
$ sudo journalctl -f # 查看指定服务的日志
$ sudo journalctl /usr/lib/systemd/systemd # 查看指定进程的日志
$ sudo journalctl _PID=1 # 查看某个路径的脚本的日志
$ sudo journalctl /usr/bin/bash # 查看指定用户的日志
$ sudo journalctl _UID=33 --since today # 查看某个 Unit 的日志
$ sudo journalctl -u nginx.service
$ sudo journalctl -u nginx.service --since today # 实时滚动显示某个 Unit 的最新日志
$ sudo journalctl -u nginx.service -f # 合并显示多个 Unit 的日志
$ journalctl -u nginx.service -u php-fpm.service --since today # 查看指定优先级(及其以上级别)的日志,共有8级
# 0: emerg
# 1: alert
# 2: crit
# 3: err
# 4: warning
# 5: notice
# 6: info
# 7: debug
$ sudo journalctl -p err -b # 日志默认分页输出,--no-pager 改为正常的标准输出
$ sudo journalctl --no-pager # 以 JSON 格式(单行)输出
$ sudo journalctl -b -u nginx.service -o json # 以 JSON 格式(多行)输出,可读性更好
$ sudo journalctl -b -u nginx.serviceqq
-o json-pretty # 显示日志占据的硬盘空间
$ sudo journalctl --disk-usage # 指定日志文件占据的最大空间
$ sudo journalctl --vacuum-size=1G # 指定日志文件保存多久
$ sudo journalctl --vacuum-time=1years

Linux 系统进程管理的更多相关文章

  1. Linux系统进程管理

    Linux系统进程管理 什么是进程 进程是已启动的可执行程序的运行实例,进程有以下组成部分: 分配内存, 已分配内存的地址空间 安全属性, 进程的运行身份和权限 进程代码, 运行一个或多个的线程 进程 ...

  2. Linux权限管理、系统进程管理

    权限管理 linux系统中分为四种角色 u=user 当前用户   g=group 同组用户   o=other 其他用户   a=all 代表所有用户 三种权限 r=read 可读 w=write ...

  3. 【CentOS】Linux日常管理

    /////////////////////////目录///////////////////////////////////////// 一.日常监控指标相关 1.监控系统状态命令 2.查看系统进程 ...

  4. Linux内存描述之内存区域zone–Linux内存管理(三)

    服务器体系与共享存储器架构 日期 内核版本 架构 作者 GitHub CSDN 2016-06-14 Linux-4.7 X86 & arm gatieme LinuxDeviceDriver ...

  5. linux用户管理-用户的基本操作

    目录 linux用户管理-用户的基本操作 用户相关的命令 linux用户管理-用户的基本操作 什么是用户 用户指能够正常登录linux或windows系统 区别 本质都是登录系统的,只不过Linux支 ...

  6. Linux用户管理 权限管理 内存管理 网络管理命令 (第四天)

    默认添加的用户会自动加入和用户名一样的组中su 切换用户查看当前登陆的用户: whoami id`查看当前用户属于哪个组:groupsgroupadd 组名 添加组groupdel 组名 删除组gre ...

  7. 笔记:Linux用户管理(补充)、权限管理、内存管理、网络管理、渗透常用命令

    一.用户管理(补充) 添加用户:useradd [选项] 用户名 useradd -u 5000 -g demogroup -G root -d /home/demo -s /bin/bash dem ...

  8. Linux—进程管理

    Linux 进程管理 1.进程管理介绍 1.1 什么是进程? 进程(Process)是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位,是操作系统结构的基础. 简而言之 ...

  9. 浅谈Linux内存管理机制

    经常遇到一些刚接触Linux的新手会问内存占用怎么那么多?在Linux中经常发现空闲内存很少,似乎所有的内存都被系统占用了,表面感觉是内存不够用了,其实不然.这是Linux内存管理的一个优秀特性,在这 ...

  10. linux内存管理

    一.Linux 进程在内存中的数据结构 一个可执行程序在存储(没有调入内存)时分为代码段,数据段,未初始化数据段三部分:    1) 代码段:存放CPU执行的机器指令.通常代码区是共享的,即其它执行程 ...

随机推荐

  1. 微信小程序-组件生命周期方法

    官方文档:https://developers.weixin.qq.com/miniprogram/dev/reference/api/Component.html 正如官方显示组件的生命周期中常用的 ...

  2. 大语言模型的预训练[5]:语境学习、上下文学习In-Context Learning:精调LLM、Prompt设计和打分函数设计以及ICL底层机制等原理详解

    大语言模型的预训练[5]:语境学习.上下文学习In-Context Learning:精调LLM.Prompt设计和打分函数(Scoring Function)设计以及ICL底层机制等原理详解 1.I ...

  3. CE修改器入门:未知数值扫描

    经过第二关的练习,你已经理解了如何利用"精确数值"扫描查找数值了,让我们进行下一步,本关主要用来搜索进度条,人物血条等,因为这些数据通常是一个进度条,我们无法直接看到的数据,此时可 ...

  4. Leetcode刷题第四天-双指针-二分法

    15:三个数之和 链接:15. 三数之和 - 力扣(LeetCode) em...双冲for循环,从头去遍历,0-(a+b)是否在列表中,最终timeout 数组从小到大排序,设置三个指针,i从头遍历 ...

  5. Spring boot 的定时任务。

    @Scheduled(fixedRate=2000):上一次开始执行时间点后2秒再次执行: @Scheduled(fixedDelay=2000):上一次执行完毕时间点后2秒再次执行: @Schedu ...

  6. 图像列表组件(TImageList)

    TImageList 组件是一组同样尺寸的图像列表,每一个图像由它的Index值查询. 1.TImageList组件的典型用法 图形列表用于建立和管理大量的图像,主要是配合菜单或者工具栏按钮的使用.图 ...

  7. 解析Sermant热插拔能力:服务运行时动态挂载JavaAgent和插件

    本文分享自华为云社区<服务运行时动态挂载JavaAgent和插件--Sermant热插拔能力解析>,作者:华为云高级软件工程师 栾文飞 一.概述 Sermant是基于Java字节码增强技术 ...

  8. Python Rich:美化终端显示效果

    Rich库的功能就像它的名字一样,使Python编程更加丰富(rich),它帮助开发者在控制台(命令行)输出中创建丰富.多彩和具有格式化的文本. 本篇总结了如何使用Rich库让我们的命令行工具更加美观 ...

  9. C# 二十年语法变迁之 C# 2,C# 3 ,C# 4参考

    C# 二十年语法变迁之 C# 2,C# 3 ,C# 4参考 https://benbowen.blog/post/two_decades_of_csharp_i/ 自从 C# 于 2000 年推出以来 ...

  10. NC200179 Colorful Tree

    题目链接 题目 题目描述 A tree structure with some colors associated with its vertices and a sequence of comman ...