Linux服务器定时健康检查,发生故障自动微信告警
此脚本适用于于各种Linux环境,可以实现各种监控项目,可自定义阀值,实现不同监控效果
已在原有脚本基础上做了简化,提取了主要功能
目前实现的有:
1、磁盘监控
2、内存监控
3、cpu负荷监控
4、进程数监控
5、iptables 状态检查(若防火墙未开启,启动防火墙)
6、多端口检查
其中若一项失败,微信提醒对应失败的监控项
脚本如下所示:
#!/bin/bash source /etc/profile Echo_Colour(){
echo -e "[\033[$1;1m$2\033[0m]"
}
Print_Format(){
printf "|%-12s|%15s|%10s|\n" "$1" "$2" "$3"
}
Print_Format2(){
printf "+%-12s+%15s+%10s+\n" "------------" "---------------" "----------"
}
Print_Select(){
Num1="$1"
Num2="$2"
if [ "`echo "$Num1 > $Num2"|bc`" == "" ];then
Print_Format "$3" "$4" "$5"
fi
}
Output_(){
TrueFalse=$
PrintVar=$
PrintResult=$
if [[ -z $TrueFalse && -n "$PrintVar" ]];then
PrintVar=`printf "%-45s" "${PrintVar}"`
echo -n -e "\033[32;49;1m[`date +%F\ %T`]\t${PrintVar}\033[39;49;0m"
elif [[ -n $TrueFalse && "$TrueFalse" == "" ]];then
Echo_Colour "" "$PrintResult"
elif [[ -n $TrueFalse && "$TrueFalse" == "" ]];then
Echo_Colour "" "$PrintResult"
else
Echo_Colour "" "syntax error";exit
fi
}
Output_Select(){
Num1="$1"
Num2="$2"
PrintTrue="$3"
PrintFalse="$4"
RetrunExit="$5"
if [ "$Num1" == "$Num2" ];then
Output_ "" "" "$PrintTrue"
else
Output_ "" "" "$PrintFalse"
$RetrunExit
fi
} weixin(){
#CropID 企业Id
#Secret 管理组的凭证密钥
CropID="wx80179d3a3eb67***"
Secret="ZyqFs4qfUiXcz8plHFbhCWkF3JEjj7vASkZjs8YTRqKxq1yAx-U46foyNXNKz2qw"
GURL="https://qyapi.weixin.qq.com/cgi-bin/gettoken?corpid=$CropID&corpsecret=$Secret"
#AccessToken是企业号的全局唯一票据,调用接口时需携带AccessToken
Gtoken=$(/usr/bin/curl -s -G $GURL | awk -F\" '{print $4}')
PURL="https://qyapi.weixin.qq.com/cgi-bin/message/send?access_token=$Gtoken"
Content=`cat $TMP`
curl -l -H "Content-type: application/json" -X POST -d "{\"touser\":\"@all\",\"msgtype\":\"text\",\"toparty\":\"1\",\"agentid\":\"1\",\"text\":{\"content\": \"Server Check Monitor:\n$Content\"}, \"safe\":\"0\"}" $PURL &>/tmp/weixin.log
} server_check(){ Cpucore="`cat /proc/cpuinfo | grep -c processor`"
Cpuload="`uptime|awk -F, '{print $(NF-1)}'|tr -d " "`"
Cpuidle="`vmstat|awk '/[0-9]+/{print $(NF-2)}'`"
MemTotal="`free -m|awk '/Mem:/{print $2}'`"
MemUse="`free -m|awk '/-\/+/{print $3}'`"
MemFree="`echo "scale=;($(($MemTotal-$MemUse))) / $MemTotal*"|bc|cut -d. -f1`"
SwapTotal="`free -m|awk '/Swap:/{print $2}'`"
SwapUse="`free -m|awk '/Swap/{print $3}'`"
SwapFree="`echo "scale=;($(($SwapTotal-$SwapUse))) / $SwapTotal*"|bc|cut -d. -f1`"
DiskUse1="`df -h|awk '/\/$/{print $(NF-3)}'`"
DiskUse1Free="`df -h|awk '/\/$/{print $(NF-1)}'|tr -d "%"`"
DiskUse1Free="`echo "scale=; - $DiskUse1Free"|bc`"
DiskUse2="`df -h|awk '/\/data$/{print $(NF-3)}'`"
DiskUse2Free="`df -h|awk '/\/data$/{print $(NF-1)}'|tr -d "%"`"
DiskUse2Free="`echo "scale=; - $DiskUse2Free"|bc`"
eth0Link="`ethtool eth0|awk '/Link/{print $NF}'`"
eth0Speed="`ethtool eth0|awk '/Speed/{print $NF}'`"
eth0Duplex="`ethtool eth0|awk '/Duplex/{print $NF}'`"
eth1Link="`ethtool eth1|awk '/Link/{print $NF}'`"
eth1Speed="`ethtool eth1|awk '/Speed/{print $NF}'`"
eth1Duplex="`ethtool eth1|awk '/Duplex/{print $NF}'`" if `/sbin/iptables -L -n|grep -q "Chain INPUT (policy DROP)"` ;then
Iptables=Yes
Iptables_bc=
else
/bin/sh /data/shelltools/web_iptable.sh >>$LogFile >&
if `/sbin/iptables -L -n|grep -q "Chain INPUT (policy DROP)"`;then
Iptables=Yes
Iptables_bc=
else
Iptables=No
Iptables_bc=
fi
fi
} Game_Check(){
GameOnLineNum=`netstat -ntp|awk '/ESTABLISHED/{print $4}'|grep -P -c ":9200|:9300"`
GameJavaProNum="`jps |grep -c "Server"`"
GameTomcatProNum="`jps |grep -c Bootstrap`"
GameNginxProNum="`ps -ef |grep -v grep|grep -c "nginx: master process"`"
} Send_Warning(){
TMP=`mktemp`
echo "${Site}:${IP} ERROR" >>$TMP >&
Print_Format2 >>$TMP >&
Print_Format "Site" "Name" "Warning" >>$TMP >&
Print_Format2 >>$TMP >&
Print_Select "$Cpuload" "$Cpucore" "$Site" "CPU Load" "$Cpuload" >>$TMP >&
Print_Select "" "$Cpuidle" "$Site" "CPU Idle" "$Cpuidle%" >>$TMP >&
Print_Select "" "$MemFree" "$Site" "Mem Idle" "$MemFree%" >>$TMP >&
Print_Select "" "$DiskUse1Free" "$Site" "/" "$DiskUse1Free%" >>$TMP >&
Print_Select "" "$DiskUse2Free" "$Site" "/data" "$DiskUse2Free%" >>$TMP >&
Print_Select "" "$GameJavaProNum" "$Site" "JavaPro" "$GameJavaProNum" >>$TMP >&
Print_Select "" "$GameTomcatProNum" "$Site" "TomcatPro" "$GameTomcatProNum" >>$TMP >&
Print_Select "" "$GameNginxProNum" "$Site" "NginxPro" "$GameNginxProNum" >>$TMP >&
Print_Select "" "$Iptables_bc" "$Site" "iptables" "$Iptables_bc" >>$TMP >&
nc -nvz -w $IP >>$LogFile >&
Print_Select "$?" "" "$Site" "$IP" "Web 80 Port Fail" >>$TMP >&
nc -nvz -w $IP >>$LogFile >&
Print_Select "$?" "" "$Site" "$IP" "SSH 22 Port Fail" >>$TMP >&
Print_Format2
sed -i '/ 2: parse error/d' $TMP
if [ `cat $TMP|wc -l` -gt ];then
cd /tmp/
weixin
fi
#cat $TMP
rm -f $TMP
} main()
{
LogFile=/root/check.log
Site=`hostname`
IP=`ifconfig eth0|grep "inet addr"|awk -F: '{print $2}'|awk '{print $1}'`
Alarm=`awk -F":" '/alarm/{print $2}' /root/config |sed 's/ //g'`
server_check >>/dev/null
Game_Check >>/dev/null
if [ $Alarm = ON ];then
Send_Warning
fi
} main #取消微信告警
#echo alarm:OFF > /root/config
auto_Check.sh
需要微信告警执行:
#echo alarm:ON > /root/config 【此为微信告警开关】
效果图如下(Java进程低于5个、80端口不通,微信告警):
Linux服务器定时健康检查,发生故障自动微信告警的更多相关文章
- 设置linux服务器定时与时间服务器同步
在一些大公司经常出现这样一个情况:公司或一些机关单位的内部业务系统的应用服务器以及数据都是做的多机集群部署而且基本都是linux系统,而且都是内部网,不与外网通讯的.这样经常就会出现一个情况,我发送任 ...
- 从Windows 服务器通过sync向Linux服务器定时同步文件
本文解决的是Windows 下目录及文件向Linux同步的问题,Windows向 Windows同步的请参考:http://www.idcfree.com/article-852-1.html 环境介 ...
- window、linux系统与linux服务器之间使用svn同步及自动部署代码的方法
摘要: 在家用PC,在公司用办公电脑对一个项目的代码进行修改时,会遇到代码同步的问题.本文讲解了代码同步及自动部署的解决办法. 实现方法: 1.首先在linux服务器上和linux上安装svn(sud ...
- redis健康检查与故障转移
哨兵三个定时监控任务 每隔10s每隔sentinel节点会向主节点和从节点发送info命令获取最新的拓扑结构 每隔2S,每个sentinel节点会向redis数据节点的__sentiel__:hell ...
- 磁盘大保健 保持你的Linux服务器存储健康
df du -sh *| sort -nr du -h --max-depth=1 / du -h --max-depth=1 /* find . -type f -size +1000000k 查找 ...
- Linux服务器定时脚本
crontab -e 进入编辑模式,同vi编辑器操作. 用户所建立的crontab文件中,每一行都代表一项任务,每行的每个字段代表一项设置,它的格式共分为六个字段,前五段是时间设定段,第六段是要执行的 ...
- Nginx负载均衡中后端节点服务器健康检查的操作梳理
正常情况下,nginx做反向代理,如果后端节点服务器宕掉的话,nginx默认是不能把这台realserver踢出upstream负载集群的,所以还会有请求转发到后端的这台realserver上面,这样 ...
- Nginx负载均衡中后端节点服务器健康检查的一种简单方式
摘自:https://cloud.tencent.com/developer/article/1027287 一.利用nginx自带模块ngx_http_proxy_module和ngx_http_u ...
- nginx backend 健康检查
ngx_http_proxy_module 模块和ngx_http_upstream_module模块(自带) 严格来说,nginx自带是没有针对负载均衡后端节点的健康检查的,但是可以通过默认自带的n ...
随机推荐
- c++入门之内置数组和array比较
array是C++11中新提出来的容器类型,与内置数组相比,array是一种更容易使用,更加安全的数组类型,可以用来替代内置数组.作为数组的升级版,继承了数组最基本的特性,也融入了很多容器操作,下面介 ...
- 亲测可以永久破解2018版本的pycharm
pycharm是很强大的开发工具,但是每次注册着实让人头疼.网络上很多注册码.注册服务器等等.但都只是一年或者不能用:为次有如下解决方案.亲测有效!!! 如果想让pycharm永久被激活,比如截止日到 ...
- mysql uuid() 相同 重复
mysql select UPPER(REPLACE(uuid(),'-','')) from xxxtable 得到相同的uuid的问题 - LWJdear的博客 - CSDN博客 https:// ...
- PV、TPS、QPS计算公式(转)
英文解释: PV=page viewTPS=transactions per secondQPS=queries per secondRPS=requests per second RPS=并发数/平 ...
- 【转帖】Linux定时任务Crontab命令详解
Linux定时任务Crontab命令详解 https://www.cnblogs.com/intval/p/5763929.html 知道有crontab 以及 at 命令 改天仔细学习一下 讲sys ...
- C# Note5:使用相对路径读取文件
一.C#中使用相对路径读取配置文件 一般Solution的目录结构如下图所示: (如过看不到某些文件,可以点击 “显示所有文件” 图标) 方法一:由于生成的exe文件在bin\debug目录下,可以使 ...
- Redis的java客户端jedis
导包:Jedis需要的jar包 >Commons-pool-1.6.jar >Jedis-2.1.0.jar 配置:linux防火墙设置,不会设置就关闭. 停止防火墙 systemctl ...
- linux中的set -e 与set -o pipefail
1.set -e "Exit immediately if a simple command exits with a non-zero status." 在“set -e”之后出 ...
- MyBatis基础:MyBatis数据基本操作(2)
1. MyBatis映射器 2. MyBatis数据基本操作 示例项目结构: <project xmlns="http://maven.apache.org/POM/4.0.0&quo ...
- linux的使用
第一 安装ubuntu操作系统 1. ubuntu下解决中英文输入法问题 问题: ubuntu在安装了搜狗输入法后无法切换英文,即使在搜狗输入法中设置了切换按键依然无反应, 原因在于当前系统中只有一个 ...