检查服务器主从状态的脚本-check_server_state.sh
分别检查服务器在Master/Slave状态下,各项服务是否正常,否则报警;
原来使用keepalived每隔1分钟调用,由于执行结果对keepalived的weight参数有影响,所以移动到外部,使用supervisord进行管理;
运行在后台,作为守护进程;
#!/bin/bash
htname=$(hostname)
vip="10.108.144.5"
epg01="10.108.144.1"
epg02="10.108.144.2"
error_number=0
function send_warn()
{
echo "Begin to send email......"
if [ $(ip addr | grep $epg01 | wc -l) -eq 1 ];then
#EPG-01
if [ -f /sunlight/python/slt_send_mail.py ];then
if [ $(ping -w 1 -c 1 baidu.com | grep ttl | wc -l) -eq 1 ];then
python /sunlight/python/slt_send_mail.py "$1"
fi
fi
else
#EPG-02
ssh -p 2222 -i /usr/local/sunlight/sshkeys/init.pk -o StrictHostKeyChecking=no $epg01 "ping -w 1 -c 1 baidu.com"
if [ $? -eq 0 ];then
ssh -p 2222 -i /usr/local/sunlight/sshkeys/init.pk -o StrictHostKeyChecking=no $epg01 "python /sunlight/python/slt_send_mail.py \"$1\""
fi
fi
echo "Send mail end......"
}
while true
do
event_string="<p><span style='color:#FF0000'>发现运行时错误!</span></p>"
error_number=0
check_vip=$(ip addr | grep $vip | wc -l)
check_cron=$(ls -l /etc/cron.d |grep "^-" | wc -l)
check_smon=$(ps -ef | grep /usr/local/sunlight/smon | grep -v grep | wc -l)
check_route=$(ip route | grep $vip | wc -l)
check_ip_conflict=$(ps -ef | grep "check_server_ip_conflict.sh" | grep -v grep | wc -l)
#master
if [ $check_vip -eq 1 ];then
echo "[ info ] `date "+%Y%m%d %H:%M:%S"` Server is in Master State!"
echo "check cron......"
echo "$check_cron"
if [ $check_cron -lt 1 ];then
error_number=1
event_string="${event_string}<p>错误描述:服务器在Master状态下,/etc/cron.d/目录下定时任务文件不存在,请登录检查!</p>"
fi
echo "check smon......"
echo "$check_smon"
if [ $check_smon -ne 1 ];then
error_number=1
event_string="${event_string}<p>错误描述:服务器在Master状态下,smon进程不为1,请登录检查!</p>"
fi
echo "check route......"
echo "$check_route"
if [ $check_route -ne 1 ];then
error_number=1
event_string="${event_string}<p>错误描述:服务器在Master状态下,虚拟路由地址没有正确设置,请登录检查!</p>"
fi
echo "check_ip_conflict......"
echo "$check_ip_conflict"
if [[ $check_ip_conflict -ne 1 && $check_ip_conflict -ne 2 ]];then
error_number=1
event_string="${event_string}<p>错误描述:服务器在Master状态下,检测IP地址冲突的脚本没有正确运行,请登录检查!</p>"
fi
fi
#slave
if [ $check_vip -ne 1 ];then
echo "[ info ] `date "+%Y%m%d %H:%M:%S"` Server is in Slave State!"
echo "check cron......"
echo "$check_cron"
if [ $check_cron -gt 0 ];then
error_number=1
event_string="${event_string}<p>错误描述:服务器在Slave状态下,/etc/cron.d/目录下定存在定时任务文件,请登录检查!</p>"
fi
echo "check smon......"
echo "$check_smon"
if [ $check_smon -ne 1 ];then
error_number=1
event_string="${event_string}<p>错误描述:服务器在Slave状态下,smon进程不为1,请登录检查!</p>"
fi
echo "check route......"
echo "$check_route"
if [ $check_route -eq 1 ];then
error_number=1
event_string="${event_string}<p>错误描述:服务器在Slave状态下,存在虚拟路由地址,请登录检查!</p>"
fi
echo "check_ip_conflict......"
echo "$check_ip_conflict"
if [[ $check_ip_conflict -ne 1 && $check_ip_conflict -ne 2 ]];then
error_number=1
event_string="${event_string}<p>错误描述:服务器在Slave状态下,检测IP地址冲突的脚本没有正确运行,请登录检查!</p>"
fi
fi
event_string="${event_string}<p>消息来源:海南-三亚-亚特兰蒂斯酒店</p>"
event_string="${event_string}<p>hostname: ${htname}</p>"
if [ $error_number -eq 1 ];then
echo $event_string
send_warn "$event_string"
fi
sleep 60
done
检查服务器主从状态的脚本-check_server_state.sh的更多相关文章
- MSC服务器-主从检测脚本-check_server_state.sh
说明: 发现keepalived会在凌晨自动进行主从切换,导致msc相关进程运行不稳定: 通过运行check_server_state.sh,及时终止/启动相关进程: 所有脚本使用supervisor ...
- 检查Mysql主从状态
.检查MySQL主从同步状态 #!/bin/bash USER=bak PASSWD=123456 IO_SQL_STATUS=$(mysql -u$USER -p$PASSWD -e show s ...
- 分布式项目中 linux 服务器 部署jar 应用脚本 deploy.sh
在实际项目的部署中,尤其是分布式项目,有很多服务的jar包需要 部署,这里抽取出公用的 deploy的脚本 下面是不含jdk配置的 #!/bin/bash JAVA_OPTIONS_INITIAL=- ...
- 编译安装nrpe,配置监控mysql端口和主从状态
1.安装插件 # tar xvf nagios-plugins-1.4.13.tar.gz # cd nagios-plugins-1.4.13 # ./configure # make && ...
- 脚本_监控 HTTP 服务器的状态
#!bin/bash#功能:监控 HTTP 服务器的状态(测试返回码) #作者:liusingbon#设置变量,url 为你需要检测的目标网站的网址(IP 或域名)url=http://192.168 ...
- 监控 HTTP 服务器的状态(测试返回码)shell脚本
#!/bin/bash # 监控 HTTP 服务器的状态(测试返回码) # 设置变量,url为你需要检测的目标网站的网址(IP 或域名),比如百度 url=http://http://183.232. ...
- python MySQL-Slave从服务器状态检测脚本
#!/bin/bash mysql -e "show slave status\G" > mysql_status.txt array=($(egrep 'Slave_IO_ ...
- 如何编写LVS对Real Server的健康状态检测脚本
简介:Linux 虚拟服务器(Linux Virtual Server. LVS),是一个由章文松开发的自由软件.利用KVS可以实现高可用的.可伸缩缩的Web, Mail, Cache和Medial等 ...
- Linux检查服务器是否被入侵
Linux检查服务器是否被入侵 检查root用户是否被纂改 awk -F: '$3==0{print $1}' /etc/passwd awk -F: '$3==0 {print}' /etc/pas ...
随机推荐
- ActiveMQ producer 流量控制
http://activemq.apache.org/producer-flow-control.html 翻译: 流量控制是指:如果broker检测到destination的内存限制.temp文件限 ...
- httpd.conf文件格式解析
apache http server,俗称apache,程序名httpd,默认配置文件/etc/httpd/conf/httpd.conf:该文件通过其中的Include conf.d/*.conf指 ...
- 数据泵导入 ORA-31626
Oracle,10G,数据泵导入时,报错如下: 解决方案:对当前用户做如下授权 . 具体操作:grant connect,resource to user;
- day12 生成器和各种推导式
今天主要学习了 1.生成器 2.生成器函数 3.各种推导式(比较诡异,理解了很简单,不理解很难) 4.生成器表达式(重点) 一.生成器 def func(): print'我叫周润发' return ...
- js 动态绑定鼠标事件
<script> function getElementsByClassName(n) { var classElements = [],allElements = document.ge ...
- 二、求水仙花数,打印出100-999之间所有的"水仙花数"
所谓"水仙花数"是指一个三位数,其各位数字立方和等于该数本身. 例如:153是一个"水仙花数",因为153=1的三次方+5的三次方+3的三次方 public c ...
- CountDownLatch在多线程程序中的应用
一.CountDownLatch介绍 CountDownLatch是JDK1.5之后引入的,存在于java.util.concurrent包下,能够使一个线程等待其他线程完成动作后再执行.构造方法: ...
- Office 365 - For security reasons DTD is prohibited in this XML document
博客地址:http://blog.csdn.net/FoxDave 今天在测试东西的时候发现在本机运行CSOM代码或使用Office 365 PowerShell时,出现了如下错误: Connec ...
- 11.Python-第三方库requests详解(三)
Response对象 使用requests方法后,会返回一个response对象,其存储了服务器响应的内容,如上实例中已经提到的 r.text.r.status_code……获取文本方式的响应体实例: ...
- 2017-2018-2 20165214 实验四《Android开发基础》实验报告
一.实验报告封面 课程:Java程序设计 班级:1652班 姓名:朱文远 学号:20165214 指导教师:娄嘉鹏 实验日期:2018年5月14日 实验时间:15:35 - 17:15 实验序号:四 ...