Linux下shell脚本监控Tomcat的状态并实现自动启动

最近公司需要在Linux下监控tomcat的服务,一旦tomcat服务存在异常或者宕机,重启tomcat保证服务的正常运行,由于Linux下有Shell脚本可以实现此效果,就没有考虑用Java代码写了,下面是Linux下shell脚本监控Tomcat的状态并实现自动启动的步骤。

1编写Shell脚本monitor.sh: 
此脚本代码参考于张小凡vip的博客https://blog.csdn.net/zzq900503/article/details/50723191

#!/bin/sh

# func:自动监控tomcat脚本并且执行重启操作
# author:EagleHao
# date:2018-04-08
# DEFINE

# 获取tomcat进程ID(其中[grep -w 'tomcat']代码中的tomcat需要替换为你的tomcat文件夹名)
TomcatID=$(ps -ef |grep tomcat |grep -w 'tomcat'|grep -v 'grep'|awk '{print $2}')

# tomcat启动程序(这里注意tomcat实际安装的路径)
StartTomcat=/usr/local/tomcat/bin/startup.sh
TomcatCache=/usr/local/tomcat/work

#定义要监控的页面地址
WebUrl=http://localhost:8080

#日志输出
GetPageInfo=/tmp/TomcatMonitor.Info
TomcatMonitorLog=/tmp/TomcatMonitor.log

Monitor()
{
echo "[info]开始监控tomcat...[$(date +'%F %H:%M:%S')]"
if [ $TomcatID ];then #这里判断Tomcat进程是否存在
echo "[info]当前tomcat进程ID为:$TomcatID,继续检测页面..."
# 检测是否启动成功(成功的话页面会返回状态"200")
TomcatServiceCode=$(curl -s -o $GetPageInfo -m 10 --connect-timeout 10 $WebUrl -w %{http_code})
if [ $TomcatServiceCode -eq 200 ];then
echo "[info]页面返回码为$TomcatServiceCode,tomcat启动成功,测试页面正常"
else
echo "[error]tomcat页面出错,请注意...状态码为$TomcatServiceCode,错误日志已输出到$GetPageInfo"
echo "[error]页面访问出错,开始重启tomcat"
kill -9 $TomcatID # 杀掉原tomcat进程
sleep 3
rm -rf $TomcatCache # 清理tomcat缓存
$StartTomcat
fi
else
echo "[error]tomcat进程不存在!tomcat开始自动重启..."
echo "[info]$StartTomcat,请稍候..."
rm -rf $TomcatCache
$StartTomcat
fi
echo "--------------------------"
}
Monitor>>$TomcatMonitorLog

#######

在写脚本的时候遇到了一个小问题,就是编写的过程中粗心,导致if的[]少了两个空格,如下:
错误格式:if [$TomcatID]
正确格式:if [ $TomcatID ]
如果少了这两个空格,脚本执行是会报错的。

编写完脚本后,先执行以下脚本:

./monitor.sh
1
如果报权限错误,需要给脚本授权

chmod 777 monitor.sh
1
脚本执行成功后,可以去/tmp目录下面查看日志文件TomcatMonitor.log,如果脚本测试没有问题,我们开始给此脚本设置一个定时任务。
先查看系统是否安装了crontab

如果没有安装,则先安装

安装crontab:

yum install crontabs

服务操作说明:

/sbin/service crond start[这里写链接内容](https://blog.csdn.net/zzq900503) //启动服务

/sbin/service crond stop //关闭服务

/sbin/service crond restart //重启服务

/sbin/service crond reload //重新载入配置

/sbin/service crond status //启动服务

安装完成后启动crontab服务,如果有如下提示(Centos7以上版本),则按照提示启动服务即可

crontab服务启动没问题后,运行crontab –e 编写一条定时任务 * * * * * /usr/local/monitor.sh 在每1分钟执行一次monitor.sh脚本。

然后重新启动crontab服务,这时再去/tmp下面查看日志文件TomcatMonitor.log,测试结果。

接下来将crontab设为开机启动chkconfig --level 35 crond on,如果有如下提示(Centos7以上版本),则按照提示设置即可

至此整个监控tomcat服务的脚本已经完成,以下是代码解析:

ps -e //显示所有进程

ps -f //按树状显示

grep tomcat //只取含有tomcat的行

grep -w 'apache-tomcat-5.5.23' //-w选项搜索一个单词,并且避免搜索到词中的部分字串。 搜索含有apache-tomcat-5.5.23的行

grep -v 'grep' //去掉含有grep的行

awk '{print $2}' //用空格切分 取第二列

ps -ef |grep tomcat |grep -w 'apache-tomcat-5.5.23'|grep -v 'grep'|awk '{print $2}' //获取tomcat的进程id

但是仅仅是 tomcat进程存在是不够的,需要访问下 站点页面看看 是否访问正常 正常状态为200 通过curl

curl -s -o $GetPageInfo -m 10 --connect-timeout 10 $WebUrl -w %{http_code} //访问页面并保存页面内容返回状态码
-s --silent //静默模式,就是不显示错误和进度
-o $GetPageInfo //将文件保存到本地并命名为$GetPageInfo
-m //表示获取网页的最长时间(数据传输的最大允许时间)
-m 10 //表示如果10秒内无法完成获取网页源码的操作,则放弃
--connect-timeout //连接超时时间
--connect-timeout 10 //表示如果10秒内无法连接,则放弃
$WebUrl //就是我们要访问的页面路径变量
-w //curl的-w参数我们可以自定义curl的输出,%{http_code}代表http状态码

如果状态码为200则 tomcat正常,否则 kill 杀掉tomcat 进程, 访问tomcat的启动脚本 start.sh 启动tomcat

再是crontab解析

crontab –e //编写一条定时任务
crontab -l //列出当前用户定时任务
crontab -r //删除当前用户定时任务

crontab文件格式:

* * * * * command

minute hour day month week command

分 时 天 月 星期 命令
minute: 表示分钟,可以是从0到59之间的任何整数。

hour:表示小时,可以是从0到23之间的任何整数。

day:表示日期,可以是从1到31之间的任何整数。

month:表示月份,可以是从1到12之间的任何整数。

week:表示星期几,可以是从0到7之间的任何整数,这里的0或7代表星期日。

command:要执行的命令,可以是系统命令,也可以是自己编写的脚本文件。

星号(*):代表所有可能的值,例如month字段如果是星号,则表示在满足其它字段的制约条件后每月都执行该命令操作。

逗号(,):可以用逗号隔开的值指定一个列表范围,例如,“1,2,5,7,8,9”。

中杠(-):可以用整数之间的中杠表示一个整数范围,例如“2-6”表示“2,3,4,5,6”。

正斜线(/):可以用正斜线指定时间的间隔频率,例如“0-23/2”表示每两小时执行一次。同时正斜线可以和星号一起使用,例如*/10,如果用在minute字段,表示每十分钟执行一次。

参考资料:
https://blog.csdn.net/zzq900503/article/details/50723191
https://www.cnblogs.com/zoulongbin/p/6187238.html
https://blog.csdn.net/weixin_41004350/article/details/78492367?locationNum=10&fps=1
---------------------

https://jsczxy2.iteye.com/blog/2170658

检测tomcat假死时重新启动及邮件通知

检测逻辑:连续3次访问tomcat提供的接口,若3次响应码都不为200,则自动重启tomcat
脚本内容:

#!/bin/bash
source /etc/profile
IP=10.78.1.183
PORT=8114
TOMCAT_DIR=/soft/tomcat_8114
#定义发送邮件函数
function send_mail(){
maillist=(
zhengwei.liu@xxx.cn
)
DATE=`date +'%F %T'`
SUBJECT="${IP}的${PORT}端口发生故障,已自动重启!"
CONTENT="时间:${DATE}\n主机:${IP}\n事件:${PORT}端口发生重启"
for mail in ${maillist[*]};do
echo -e "${CONTENT}" | mail -s "${SUBJECT}" $mail
done
}
#对接口访问3次
declare -i NUM=0
for i in `seq 1 3`;do
CODE=$(/usr/bin/curl -I -m 10 -o /dev/null -s -w %{http_code}"\n" http://${IP}:${PORT})
if [ $CODE == "000" ];then
((NUM++))
fi
sleep 3
done
#根据NUM的值来确定是否重启tomcat,NUM=3时进行重启
if [ $NUM == 3 ];then
IS_LIVING=`jps -m -l -v | grep "${PORT}" | wc -l`
if [ ${IS_LIVING} -eq 1 ];then
PID=`jps -m -l -v | grep "${PORT}" | awk '{print $1}'`
kill -9 $PID
${TOMCAT_DIR}/bin/startup.sh
elif [ ${IS_LIVING} -eq 0 ];then
${TOMCAT_DIR}/bin/startup.sh
fi
send_mail
fi

任务计划:每5分钟检测一次

*/5 * * * * /server/scripts/tomcat/check_8114.sh &> /dev/null

linux环境进程开机自检脚本的更多相关文章

  1. Linux定时任务与开机自启动脚本(cron与crontab)

    开机自启动脚本 网上常见的脚本开机自启方法是: 假设要自启的脚本位于 /home/user/test.sh 给脚本可执行的权限 sudo chmod +x /home/user/test.sh 将脚本 ...

  2. Linux 环境下开机自启动Oracle服务

    使用如下命令查看Oracle相关服务是否已启动: ps aux | grep ora_ #若无ora_**_**相关的进程,则oracle数据库实例未启动 netstat -tlnup | grep ...

  3. Linux环境数据备份Python脚本

    #!/usr/bin/python#Filename:backupscript.pyimport osimport time # The files and directories to be bac ...

  4. linux环境进程的停止

    使用 #ps auxf|grep 你想要获取的进程,如下,我想要获得的是nginx的进程号 图中黄色的便是进程号, 在此我们想kill掉主进程就要把后面有master字样的进程号kill掉 命令如下 ...

  5. linux环境下编写shell脚本实现启动停止tomcat服务

    第一步:以管理员的身份进入控制台,在指定目录下新建一个shell脚本,我这里命名为tomcat.sh 第二步:编写shell脚本 #!/bin/bash tomcat_home=/usr/tomcat ...

  6. 在LINUX环境下定时执行php脚本

    1. 使用Crontab定时执行linux环境下的php脚本文件 Cron,它是一个linux下的定时执行工具.根用户以外的用户可以使用 crontab 工具来配置 cron 任务.所有用户定义的 c ...

  7. Supervisor安装与配置(Linux/Unix进程管理工具)

    原文链接:http://blog.csdn.net/xyang81/article/details/51555473 Supervisor(http://supervisord.org/)是用Pyth ...

  8. jmeter(二十五)linux环境运行jmeter并生成报告

    jmeter是一个java开发的利用多线程原理来模拟并发进行性能测试的工具,一般来说,GUI模式只用于创建脚本以及用来debug,执行测试时建议使用非GUI模式运行. 这篇博客,介绍下在linux环境 ...

  9. Jmeter(五十四) - 从入门到精通高级篇 - 如何在linux系统下运行jmeter脚本 - 上篇(详解教程)

    1.简介 上一篇宏哥已经介绍了如何在Linux系统中安装Jmeter,想必各位小伙伴都已经在Linux服务器或者虚拟机上已经实践并且都已经成功安装好了,那么今天宏哥就来介绍一下如何在Linux系统下运 ...

随机推荐

  1. Java中使用Redis的几种数据类型总结

    1.String,最基本的类型 方法  set.get 2.hash redis 127.0.0.1:6379> HMSET user:1 username redis.net.cn passw ...

  2. 模拟赛DAY 2 T2不老梦

    [题目背景] 于万人中万幸得以相逢,刹那间澈净明通. 成为我所向披靡的勇气和惶恐,裂山海,堕苍穹. 爱若执炬迎风,炽烈而哀恸,诸般滋味皆在其中. 韶华宛转吟诵,苍凉的光荣,急景凋年深情难共. ——银临 ...

  3. tensorflow和keras的安装

    1 卸载tensorflow方法,在终端输入:  把protobuf删除了才能卸载干净. sudo pip uninstall protobuf sudo pip uninstall tensorfl ...

  4. 安装node和npm和vue-cli和webpack-cli

    下载node(http://nodejs.cn/download/),安装时直接下一步,安装路径不要有汉字和空格查看node和npm是否安装成功,检查版本:node -vnpm -v 安装淘宝的cnp ...

  5. [10期]浅谈SSRF安全漏洞

    引子:SSRF 服务端请求伪造攻击 很多web应用都提供从其他服务器上获取数据的功能.使用用户指定的URL,web应用可以从其他服务器获取图片,下载文件,读取文件内容等. 这个功能被恶意使用的话,可以 ...

  6. 20191003 尚硅谷Spring Cloud教学视频

    视频信息 视频日期:2018-4-19 讲师:尚硅谷周阳 Spring Cloud版本:Dalston.RELEASE 当前版本:Greenwich SR3 微服务.微服务架构.Spring Clou ...

  7. python+selenium的frame表单切换

    switch_to.frame()                               切换frame switch_to.default_content()                切 ...

  8. 使用lua实现try-catch异常捕获

    lua原生并没有提供try-catch的语法来捕获异常处理,但是提供了pcall/xpcall等接口,可在保护模式下执行lua函数. 因此,可以通过封装这两个接口,来实现try-catch块的捕获机制 ...

  9. ceph部署-基础部署

    一.硬件要求:CPU:4C内存:每个守护进程需要500MRAM,1TB存储对应1GRAM磁盘:至少1TB网卡:1GB以上,最好两个 centos7环境安装 二.CEPH安装1.建立管理节点(1)添加y ...

  10. Postman—上个接口返回数据作为下个接口入参

    //将数据解析成json格式 var data=JSON.parse(responseBody); //获取totalRentPrice值 var totalRentPrice=jsonData.da ...