前言

    zabbix-server昨天出了个问题,不停的重启。昨天摆弄到晚上也不搞清楚原因,按照网上说的各种操作,各种CacheSize、TimeOut、StartPollers都改了,还有什么Include的日志也不贴说个丢,,,想着今天一早来处理下,结果出了生产事故。

    刚好最近超融合不稳定,凌晨的时候,生产环境有台服务器(注册中心和配置中心)无故重启,然后导致一系列的问题,这个不在这里赘述,来讲一下zabbix这个事吧。

环境

  1. CentOS Linux release 7.6.1810 (Core)
  2. mysql 5.7 # docker启动,数据落盘

zabbix参照官方文档 安装的5.0TLS+CentOS7+Mysql+Nginx版。

  1. zabbix_server (Zabbix) 5.0.5
  2. Revision eaa427cf19 26 October 2020, compilation time: Oct 26 2020 12:20:11
  3. Copyright (C) 2020 Zabbix SIA
  4. License GPLv2+: GNU GPL version 2 or later <http://gnu.org/licenses/gpl.html>.
  5. This is free software: you are free to change and redistribute it according to
  6. the license. There is NO WARRANTY, to the extent permitted by law.
  7. This product includes software developed by the OpenSSL Project
  8. for use in the OpenSSL Toolkit (http://www.openssl.org/).
  9. Compiled with OpenSSL 1.0.2k-fips 26 Jan 2017
  10. Running with OpenSSL 1.0.2k-fips 26 Jan 2017

PS:本人对zabbix了解不多,只是会安照官方和网上的文档安装配置,自己会做一些自定义的监控配置。

问题

zabbix-server不停重启,登录页面也打不开,zabbix-server.log报错如下:

  1. 2148:20210603:143421.801 Starting Zabbix Server. Zabbix 5.0.5 (revision eaa427cf19).
  2. 2148:20210603:143421.801 ****** Enabled features ******
  3. 2148:20210603:143421.801 SNMP monitoring: YES
  4. 2148:20210603:143421.801 IPMI monitoring: YES
  5. 2148:20210603:143421.801 Web monitoring: YES
  6. 2148:20210603:143421.801 VMware monitoring: YES
  7. 2148:20210603:143421.801 SMTP authentication: YES
  8. 2148:20210603:143421.801 ODBC: YES
  9. 2148:20210603:143421.801 SSH support: YES
  10. 2148:20210603:143421.801 IPv6 support: YES
  11. 2148:20210603:143421.801 TLS support: YES
  12. 2148:20210603:143421.801 ******************************
  13. 2148:20210603:143421.801 using configuration file: /etc/zabbix/zabbix_server.conf
  14. ...
  15. ...
  16. 2179:20210603:143423.081 ================================
  17. 2179:20210603:143423.081 Please consider attaching a disassembly listing to your bug report.
  18. 2179:20210603:143423.081 This listing can be produced with, e.g., objdump -DSswx zabbix_server.
  19. 2179:20210603:143423.081 ================================
  20. 2148:20210603:143423.082 One child process died (PID:2179,exitcode/signal:1). Exiting ...
  21. zabbix_server [2148]: Error waiting for process with PID 2179: [10] No child processes
  22. 2148:20210603:143423.088 syncing history data...
  23. 2148:20210603:143423.097 syncing history data... 100.000000%
  24. 2148:20210603:143423.097 syncing history data done
  25. 2148:20210603:143423.097 syncing trend data...
  26. 2148:20210603:143423.102 syncing trend data done
  27. 2148:20210603:143423.102 Zabbix Server stopped. Zabbix 5.0.5 (revision eaa427cf19).

处理过程

  日志里是没有体现出内存、缓存、MySQL等问题,于是网上各种检索。做了各种操作,全套重启、修改CacheSize、查看子进程锁死情况、清数据库。

  后面把MySQL直接初始化,发现zabbix-server启动了几分钟,然后又开始无间断重启。登录页也报错 Database error Connection timed out,查看zabbix-server.conf没有问题。然后找官方的安装文档,发现zabbix是front、server分离的。。。emmm这个时候好像找到问题了。

  检查前端的配置发现/etc/zabbix/web/zabbix.conf.php下的mysql信息竟然不对???WTF!!!赶紧修改。然后重启

  1. systemctl stop zabbix-server zabbix-agent rh-nginx116-nginx rh-php72-php-fpm
过了几分钟,zabbix-server又开始重启,然后想到网上的一篇文档,修改报警媒介类型里mail的配置-安全链接:改成STARTTLS(纯文本通信协议扩展)。终于恢复了。。。

PS:

使用一些开源软件的时候,还是要多了解一下软件本身的架构,维护起来也会更加得心应手。

特别感谢:

https://blog.csdn.net/liuxiangyang_/article/details/100024641

https://yunwei365.blog.csdn.net/article/details/103677447

https://blog.csdn.net/h106140873/article/details/104311586

记一次zabbix-server故障恢复导致的事故 zabbix-server.log -- One child process died的更多相关文章

  1. 记因PHP的内存溢出导致的事故之解决

    如果对您有用记得关注,更多干货. 今天上午刚到公司,就有同事在公司群里反映某个计划任务出现问题了.我就怀着刨根问底的心,去查看了log.发现挺有意思的一个问题,PHP内存溢出导致脚本执行失败.那就一起 ...

  2. 记一次因证书问题导致请求失败问题SSLHandshakeException

    记一次因证书问题导致请求失败问题SSLHandshakeException 转载请注明出处:https://www.cnblogs.com/funnyzpc/p/10989813.html 最近接一外 ...

  3. SQL SERVER 临时表导致存储过程重编译(recompile)的一些探讨

    SQLSERVER为了确保返回正确的值,或者处于性能上的顾虑,有意不重用缓存在内存里的执行计划,而重新编译执行计划的这种行为,被称为重编译(recompile).那么引发存储过程重编译的条件有哪一些呢 ...

  4. 由于启动用户实例的进程时出错,导致无法生成 SQL Server 的用户实例。该连接将关闭。

    错误:由于启动用户实例的进程时出错,导致无法生成SQL Server的用户实例. 原因:添加安装SQLEXPRESS时,估计装在了不同的目录下: 解决方法:关闭Sqlserver及相关的程序,删除目录 ...

  5. 由于检索用户的本地应用程序数据路径时出错,导致无法生成 SQL Server 的用户实例

    /”应用程序中的服务器错误. 由于检索用户的本地应用程序数据路径时出错,导致无法生成 SQL Server 的用户实例.请确保该用户在此计算机上有本地用户配置文件.该连接将关闭. 堆栈跟踪: [Sql ...

  6. Zabbix实战-简易教程(4)--Server端安装

    在数据库安装完成后,接着开始安装server端了.我们这里采用yum安装. 3.2.0 安装需求 ● PHP 5.6.18 ● curl 7.47.1 ● zabbix_server (Zabbix) ...

  7. Zabbix实战-简易教程(6)--Server端高可用

    3.4 server前端高可用    至此,单台Zabbix server环境已经搭建完成,为了达到高可用效果,我们需要通过2台服务器之间通过HA软件进行探测,一旦检测到主的server挂掉后,从的s ...

  8. 云计算之路-出海记:建一个免费仓库 Amazon RDS for SQL Server

    上周由于园子后院起火,不得不调兵回去救火,出海记暂时停更,这周继续更新,"出海记"记录的是我们在 AWS 上建设博客园海外站的历程. 在这一记中记录的是我们基于 AWS 免费套餐( ...

  9. Could not publish server configuration for Tomcat v6.0 Server at localhost.

    经常在使用tomcat服务器的时候 总会发生一些莫名其妙的错误. 就像下面这个错误: 在配置文件中存在多个/MyWeb的配置,导致不能发布服务. 错误信息: Could not publish ser ...

随机推荐

  1. JDBC_15_悲观锁和乐观锁

    悲观锁和乐观锁 并发控制 当程序中可能出现并发操作的情况时,就需要保证在并发操作的情况下数据的准确性,以此确保当前用户和其他用户一起操作时,所得到的结果和某个用户单独操作时的结果是一样的.这种手段就叫 ...

  2. PE结构分析(二)

    在表中,我们知道了0x01 4c对应的平台结构是i386: 我们接着分析下一个字段,给出PE结构图 向后推移2个字节,现在来到(图片高亮部分): 高亮部分对应IMAGE_NT_HEADERS结构的Nu ...

  3. Java文档注释全攻略

    注释:注释起到对代码标注和解释的作用,如果你去看看JDK源码,会发现他们有许多的注释,而且注释是比代码还要多的,可见为代码添加注释是非常重要的,写好注释能让别人更加容易看懂你的代码,注释可以分为以下三 ...

  4. 1-3 Postman 注册账号与登录

    1.为什么要注册postman账号 注册postman账号是免费的.当注册并登陆一个postman账号后,用户可以获得如下权限. (1)同步和备份历史,集合,环境,和预置头. (2)可以轻松的处理来自 ...

  5. Nginx 负载均衡方案

    轮询 根据Nginx配置文件中的顺序,每个请求按时间顺序逐一分配到不同的后端服务器,如果后端服务器 down 掉,能自动剔除. upstream web { server server1; serve ...

  6. hdu2962 二分 + spfa

    题意:       给你一个无向图,每条路径上都有自己的长度和最大承受高度,给你起点终点还有车的最大承装高度,问你高度最大的前提下路径最短是多少,求高度和路径. 思路:      这种类型题目太多了, ...

  7. 洛谷P1422 小玉家的电费

    题目描述 夏天到了,各家各户的用电量都增加了许多,相应的电费也交的更多了.小玉家今天收到了一份电费通知单.小玉看到上面写:据闽价电[2006]27号规定,月用电量在150千瓦时及以下部分按每千瓦时0. ...

  8. 对c语言回调函数的理解

    对于回调函数,可以简单的理解为一种特别的函数调用方法,我们可以对比一下回调函数与普通函数在调用方法上的区别. 1. 普通函数调用 一般为实现方在其函数体执行过程中直接调用. 代码示例: #includ ...

  9. Portswigger web security academy:Stored XSS

    Portswigger web security academy:Stored XSS 目录 Portswigger web security academy:Stored XSS Stored XS ...

  10. Redis中几种数据类型的基本操作指令

    Redis基本指令 单线程+多路IO复用技术 1. Key 指令 作用 keys * 查看当前库所有键 exists <key> 判断此键是否存在 type <key> 查看键 ...