systemd实践: 依据情况自动重启服务【转】
1.最简单的自动重启范例
- [Unit]
- Description=mytest
- [Service]
- Type=simple
- ExecStart=/root/mytest.sh
- Restart=always
- RestartSec=
- StartLimitInterval=
- [Install]
- WantedBy=multi-user.target
重点参数详解
Restart=always: 只要不是通过systemctl stop来停止服务,任何情况下都必须要重启服务,默认值为no
RestartSec=5: 重启间隔,比如某次异常后,等待5(s)再进行启动,默认值0.1(s)
StartLimitInterval: 无限次重启,默认是10秒内如果重启超过5次则不再重启,设置为0表示不限次数重启
2.案例需求
需求:有个业务,当程序因受到OOM而退出的时候,不希望自动重启(此时需要人工介入排查),其他情况下可以自动重启
分析:OOM就是通过kill -9来杀进程,因此只要找到方法,告诉systemd当该服务遇到kill -9时候不自动重启即可
3.RestartPreventExitStatus参数
查询man systemd.service发现,systemd的[Service]段落里支持一个参数,叫做RestartPreventExitStatus
该参数从字面上看,意思是当符合某些退出状态时不要进行重启。
该参数的值支持exit code和信号名2种,可写多个,以空格分隔,例如
RestartPreventExitStatus=143 137 SIGTERM SIGKILL
表示,当退出情况只要符合以下4种情况中任意一种时候,则不再进行重启
exit code为143
exit code为137
信号为TERM
信号为KILL
但具体如何使用,请继续往下看
4.测试方法
/usr/lib/systemd/system/mytest.service
- [Unit]
- Description=mytest
- [Service]
- Type=simple
- ExecStart=/root/mem
- Restart=always
- RestartSec=
- StartLimitInterval=
- RestartPreventExitStatus=SIGKILL
- [Install]
- WantedBy=multi-user.target
/root/mem.c(不断消耗内存直至发生OOM)
- #include <stdio.h>
- #include <malloc.h>
- #include <stdlib.h>
- #include <string.h>
- #include <unistd.h>
- int main ()
- {
- char *p = NULL;
- int count = ;
- while(){
- p = (char *)malloc(**);
- if(!p){
- printf("malloc error!n");
- return -;
- }
- memset(p, , **);
- printf("malloc %dM memoryn", *count++);
- usleep();
- }
- }
编译及执行
- gcc -o /root/mem /root/mem.c
- systemctl daemon-reload
- systemctl start mytest
5.测试结果
- [root@fzxiaomange ~]# systemctl status mytest
- ● mytest.service - mytest
- Loaded: loaded (/usr/lib/systemd/system/mytest.service; disabled; vendor preset: disabled)
- Active: failed (Result: signal) since Sat -- :: CST; 45s ago
- Process: ExecStart=/root/mem (code=killed, signal=KILL)
- Main PID: (code=killed, signal=KILL)
- Oct :: fzxiaomange.com systemd[]: Started mytest.
- Oct :: fzxiaomange.com systemd[]: Starting mytest...
- Oct :: fzxiaomange.com systemd[]: mytest.service: main process exited, code=killed, status=/KILL
- Oct :: fzxiaomange.com systemd[]: Unit mytest.service entered failed state.
- Oct :: fzxiaomange.com systemd[]: mytest.service failed.
重点看上面第6行
MainPID:10555(code=killed,signal=KILL)
,这行表示主进程的状态,常见有2种情况
code=exited, status=143:表示systemd认为主进程自行退出的,exit code为143
code=killed, signal=KILL:表示systemd认为主进程是被kill的,接收到的信号是SIGKILL
等待5秒后,并没有自动重启,符合预期
此时将RestartPreventExitStatus=SIGKILL改为RestartPreventExitStatus=SIGTERM
执行systemctl restart mytest,再进行一次观察,等待5秒后,服务自动重启,符合预期
6.注意事项
6.1.RestartPreventExitStatus与Restart的关系
配置RestartPreventExitStatus=后,并没有完全忽略Restart=,而是指当退出情况与RestartPreventExitStatus=匹配的时候,才忽略Restart=,若没有匹配,根据Restart=该怎么样还怎么样(具体详见后面的详细测试数据)
6.2.kill子进程会是什么情况
若systemd启动的不是一个简单进程,而是会派生子进程的情况(比如执行shell脚本,shell脚本里启动多个程序),那么当另外开一个窗口通过 kill-信号
测试时,会是什么情况呢,先贴出测试方法
ExecStart=/root/mem改为ExecStart=/root/mytest.sh
/root/mytest.sh内容为
#!/bin/bash
sleep 100000 &
sleep 200000
测试结果
若kill 主进程PID(kill不带参数),则主进程状态为
code=killed,signal=TERM
若kill -9 主进程PID,则主进程状态为
code=killed,signal=KILL
若kill 最后一个子进程PID(kill不带参数),则systemd不认为是接收到信号,而是根据最后一个进程的exit code进行处理,此时主进程状态为
code=exited,status=143
若kill -9 最后一个子进程PID,此时主进程状态为
code=exited,status=137
7.详细测试数据
上面有提到RestartPreventExitStatus和Restart的关系,但没有数据说明
另外,kill和kill -9的区别,也需要有一份数据说明
因此做了一个详细对比,这里附上详细数据
转自
systemd实践: 依据情况自动重启服务 – 小慢哥的技术网站 https://fzxiaomange.com/2018/10/21/systemd-restartpreventexitstatus/
技术|Systemd服务简介 https://linux.cn/article-3352-3.html
systemd实践: 依据情况自动重启服务【转】的更多相关文章
- systemd实践: 依据情况自动重启服务
systemd服务异常自动重启很好用,但有的时候希望某些服务只在特定情况下进行重启,其他时候不要自动重启(比如OOM,需要人工介入). 本文抛砖引玉,旨在能够让读者对systemd的重启机制有一定了解 ...
- zabbix通过curl命令判断web服务是否正常并自动重启服务
zabbix通过curl命令判断web服务是否正常并自动重启服务 主要思路: 通过curl命令获取服务器响应码,如果正常返回200,不正常返回000 具体命令: curl -I -s -w " ...
- windows service自动重启服务
服务一般都能正常的运行,但有时候也会有一些假死现象,比如公司有一考勤服务就因为依赖于硬件厂家的api, 但厂家api运行一段时间后会默名的假死,引起整个服务假死,因为这一假死现象具有不确定性,所以不太 ...
- Node.js热部署代码,实现修改代码后自动重启服务方便实时调试
写PHP等脚本语言的时候,已经习惯了修改完代码直接打开浏览器去查看最新的效果.而Node.js 只有在第一次引用时才会去解析脚本文件,以后都会直接访问内存,避免重复载入,这种设计虽然有利于提高性能,却 ...
- 监控windows服务,当服务停止后自动重启服务
近期花时间研究了一下windows和linux下某服务停了后自动重启的功能,在网上收集了些资料,并经过测试,在此整理一下.这里介绍的是windows服务的监控,是通过批处理来实现的.本例是监控wind ...
- nodejs之pm2自动重启服务
pm2 start xxx #启动服务器 pm2 list #查看运行状态 pm2 logs #查看日志 pm2 restart xxx #重启应用 pm2 stop xxx #停止应用 监听修改,并 ...
- swoft实现自动重启服务 转
目的:1.上传代码后HTTP服务自动重启,不需要自己手动执行:php bin/swoft http:start2.自动重启适用于开发调试阶段,因为不能再后台运行所以在线上环境的话还是要重启http服务 ...
- monit 监控并自动重启服务
原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本声明.否则将追究法律责任.http://coolerfeng.blog.51cto.com/133059/50126 Mo ...
- centos7下rsync+inotify脚本实现文件同步,.NET CORE客户端文件更新后自动重启服务
源服务器IP:192.168.8.51 目标服务器IP:192.168.8.79 安装前源服务器及目标服务器均需关闭FIREWALLD\SELINUX防火墙 sestatus | grep statu ...
随机推荐
- jenkins 基本配置
修改jenkins使用用户和启动端口 //yum 安装 cat /etc/sysconfig/jenkins 安装完后安装maven插件 设置jenkins项目存放目录 系统管理---->系统设 ...
- VirtualBox使用入门
VirtualBox使用入门 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 能玩虚拟机的人多少是懂点运维的,因此我就不跟大家介绍啥事虚拟化了.关于虚拟化产品大家用的应该也都大同小异 ...
- nGrinder TestRunner DNS / sun.net.spi.nameservice.NameServiceDescriptor
s ngrinder3.3控制台验证脚本报错 http://ngrinder.642.n7.nabble.com/ngrinder3-3-td1301.html 目前发现3.3版本在控制台校验脚本报错 ...
- 面向对象【林老师版】:面向过程vs面向对象(一)
一.面向过程 1.引子 面向过程:核心是过程二字,过程指的是解决问题的步骤,设计一条流水线,机械式的思维方式优点:复杂的问题流程化,进而简单化缺点:可扩展性差 2.验证代码 import json i ...
- HTTP深入理解
HTTP被设计于二十世纪九十年代初期,是一种可扩展的协议, 它是应用层的协议, 通过TCP,或TLS加密的TCP连接来发送, 理论上任何可靠的传输协议都可以使用. 因其良好的扩展性,时至今日,它不仅被 ...
- Git(管理修改)
现在,假定你已经完全掌握了暂存区的概念.下面,我们要讨论的就是,为什么Git比其他版本控制系统设计得优秀,因为Git跟踪并管理的是修改,而非文件. 你会问,什么是修改?比如你新增了一行,这就是一个修改 ...
- OPCServer:使用KEPServer
实际OPCServer使用(450M,中文,破解时间限制):KEPServer V6,百度网盘 ,密码: ykj2 本文为Java实现OPC通信的一部分 KEPServer中文官网 KEPServer ...
- 2018牛客网暑期ACM多校训练营(第三场)C Shuffle Cards(可持久化平衡树/splay)
题意 牌面初始是1到n,进行m次洗牌,每次抽取一段放到最前面.求最后的序列. 分析 神操作!!!比赛时很绝望,splay技能尚未点亮,不知道怎么用. 殊不知,C++库里有rope神器,即块状链表. 基 ...
- PHP7 网络编程(五)进程间通信【待】
https://blog.csdn.net/godleading/article/details/78391159
- 如何转换cdr文件
You will need to copy the type library from corelDRAW: C:\Program Files (x86)\Corel\CorelDRAW Graphi ...