#!/bin/bash#设置解析#安装zabbix源.aliyun YUM源# rpm -ivh http://repo.zabbix.com/zabbix/4.0/rhel/7/x86_64/zabbix-release-4.0-1.el7.noarch.rpm  官方源rpm -ivh https://mirrors.aliyun.com/zabbix/zabbix/4.0/rhel/7/x86_64/zabbix-agent-4.0.1-1.el7.x86_64.rpmyum clean…
Zabbix 4.0.2试用(七):在Linux主机中安装zabbix agent并添加主机(yum源安装) 2018年12月20日, 上午6:42 之前介绍的是下载源安装包,编译安装的方式来安装agent,本次将采用yum源方式安装,前提是主机需要与互联网相通,操作如下: 1.关闭防火墙和SELINUX 使用root用户登陆系统: 首先查看防火墙状态 [root@zabbix ~]# firewall-cmd –state running [root@zabbix ~]# 关闭firewall…
点击返回:自学Zabbix之路 点击返回:自学Zabbix4.0之路 点击返回:自学zabbix集锦 Zabbix4.4.1系统告警“Zabbix agent is not available (for 3m)” 首先查看Zabbix Agent的日志,找到关键出错信息,日志如下: cat /var/log/zabbix/zabbix_server.log 由上图log日志可见,显示Zabbix Agent无法通过/var/lib/mysql/mysql.sock连接到本地数据库服务器连接数据库…
Zabbix WebUI 配置监控Zabbix Agent 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.部署zabbix服务 1>.部署zabbix server 和zabbix web 博主推荐阅读: https://www.cnblogs.com/yinzhengjie2020/p/12305427.html 2>.部署zabbix agent 博主推荐阅读: https://www.cnblogs.com/yinzhengjie2020/p/12309682.h…
1.问题: 最近在做日志的实时同步,上线之前是做过单份线上日志压力测试的,消息队列和客户端.本机都没问题,但是没想到上了第二份日志之后,问题来了: 集群中的某台机器 top 看到负载巨高,集群中的机器硬件配置一样,部署的软件都一样,却单单这一台负载有问题,初步猜测可能硬件有问题了. 同时,我们还需要把负载有异常的罪魁祸首揪出来,到时候从软件.硬件层面分别寻找解决方案. 2.排查: 从 top 中可以看到 load average 偏高,%wa 很高,%us 偏低: 从上图我们大致可以推断 IO…
linux系统监控常用工具 一.系统核心工具包(coreutils) 1./bin/df 报告系统的磁盘空间用量 df -h  显示磁盘分区fdisk -l 2./bin/uname 显示系统信息 uname -srvmo 二.系统进程工具包(procps) 1./bin/ps 显示系统进程 ps -ef      ps aux 2./usr/bin/pgrep 过滤显示系统进程 3./usr/bin/free 显示系统内存的使用 4./usr/bin/vmstat 报告虚拟内存的统计信息 5.…
Linux系统监控实用工具Glances Glances安装 Glances安装要求:python >= 2.6 和 psutil >= 0.4.1 1.第一步,安装了python->2.6 2.第二步,安装了psutil->0.4.1 #tar -zxvf psutil.包. #cd psutil包 #python setup.py install 3.第三步,安装glances #tar -zxvf glances.包 # cd glances # python setup.p…
  python进行linux系统监控 Linux系统下: 静态指标信息: 名称 描述 单位 所在文件 mem_total 内存总容量 KB /proc/meminfo disks 磁盘相关信息 - - disks.size 磁盘总容量 KB /sys/block disks.partitions 磁盘分区相关信息 - /proc/partitions disks.partitions.avail 磁盘分区的可用空间 KB /sys/block disks.partitions.on 磁盘分区的…
linux系统监控sar命令详解 sar(System Activity Reporter系统活动情况报告)是目前 Linux 上最为全面的系统性能分析工具之一,可以从多方面对系统的活动进行报告, 包括:文件的读写情况.系统调用的使用情况.磁盘I/O.CPU效率.内存使用状况.进程活动及IPC有关的活动等. sar命令常用格式 sar [options] [-A] [-o file] t [n] 其中: t为采样间隔,n为采样次数,默认值是1: -o file表示将命令结果以二进制格式存放在文件…
创建思路 首先说下自动发现强大的功能,它到底可以帮助我们完成什么工作: 快速发现并添加主机 简单的管理 随着环境的改变而快速搭建监控系统 自动发现基于网络发现功能,而网络发现又基于以下信息: IP地址段 基于服务的FTP.SSH.Web.POP3.IMAP.TCP等 从Zabbix-agent端接收的信息 从SNMP agent端接受的信息 好了了解到以上信息,我们可以理解创建自动发现的过程为,zabbix-server会扫描你添加的IP地址段.比如你需要添加IP地址段为192.168.80.1…
前言 随着Devops.云计算.微服务.容器等理念的逐步落地和大力发展,机器越来越多,应用越来越多,服务越来越微,应用运行基础环境越来多样化,容器.虚拟机.物理机不一而足.面对动辄几百上千个虚拟机.容器,数十种要监控的对象,现有的监控系统还能否支撑的住?来自于容器.虚拟机.物理机.网络设备.中间件的指标数据如何采用同一套方案快速.完整的收集和分析告警?怎样的架构.技术方案才更适合如此庞大繁杂的监控需求呢? 上篇文章<建设DevOps统一运维监控平台,先从日志监控说起>主要从日志监控的方面进行了…
如果添加的agent端数量较少时 , 手动添加还是可以的 , 如果数量较多 , 那么zabbix-server 的Discovery自动发现功能便派上了用场 首先所需要加入的服务器zabbix-agent已经安装 防火墙都开放端口,主要是10050.10051端口,或者关闭整个iptables 打开zabbix-agent.conf配置文件,只需要修改2处配置.大批量的修改,可以利用自动化部署工具.如saltstack.ansible等 我用的是saltstack推送文件的方式进行修改,我用的是…
命令 功能应用 用法举例     free 查看内存使用情况,包括物理内存和虚拟内存 free -h或free -m     vmstat 对系统的整体情况进行统计,包括内核进程.虚拟内存.磁盘.陷阱和 CPU 活动的统计信息 vmstat 2 100     top 实时显示系统中各个进程的资源占用状况及总体状况 top     mpstat 实时系统监控工具,它会报告与CPU相关的统计信息 mpstat     sar 收集.报告和保存CPU.内存.输入输出端口使用情况 sar -n DEV…
一.实验介绍 1.1 实验内容 本课程实现 shell 脚本监控系统的各项参数,并可以将脚本加入系统环境中,可以直接在终端里执行.还添加了几个参数,一个脚本可以执行不同的操作. 1.2 知识点 本实验涵盖以下知识点: Bash 脚本编程 如何获取 Linux 系统信息 如何实时获取 Linux 资源使用率 1.3 实验环节 vim编辑器 shell解释器(linux自带) 1.4 适合人群 适合人群:本课程适合有shell语法基础,想学习shell脚本的实际使用的同学,可以加深对于shell脚本…
zabbix(音同 zæbix)是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案. zabbix能监视各种网络参数,保证服务器系统的安全运营:并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题. zabbix由2部分构成,zabbix server与可选组件zabbix agent. zabbix server可以通过SNMP,zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在Linux,So…
>>PID.TID的区分 uid是user id,即用户id,root用户的uid是0,0为最高权限,gid是group id,用户组id,使用 id 命令可以很简单的通过用户名查看UID.GID:~$ id bingyueuid=1000(bingyue) gid=1000(bingyue) groups=1000(bingyue)~$ id rootuid=0(root) gid=0(root) groups=0(root)pid是process id,即进程id,可以通过pid找到这个进…
1.PID.TID的区分 uid是user id,即用户id,root用户的uid是0,0为最高权限,gid是group id,用户组id,使用 id 命令可以很简单的通过用户名查看UID.GID:~$ id bingyueuid=1000(bingyue) gid=1000(bingyue) groups=1000(bingyue)~$ id rootuid=0(root) gid=0(root) groups=0(root)pid是process id,即进程id,可以通过pid找到这个进程…
1.1    选择虚拟机添加一块硬盘 1.2    查看系统当前磁盘信息 [root@zhongyi-test ~]# ls -l /dev/sd* brw-rw----. 1 root disk 8, 0 Jun 10 09:49 /dev/sda brw-rw----. 1 root disk 8, 1 Jun 10 09:49 /dev/sda1 brw-rw----. 1 root disk 8, 2 Jun 10 09:49 /dev/sda2 brw-rw----. 1 root d…
1.前言 我们在实际工作当中,都碰到过误操作.误删除.误修改过配置文件等等事件.对于没有堡垒机的公司来说,要在linux系统上深究到底谁做过配置文件的修改.做过误删除是很头疼的事情,特别是遇到删库跑路的事件,更头大了.当然你可以通过history来查看历史命令记录,如果把history记录涂抹掉了,是不是啥也看不到了,如果你想查看在某个时间段到底是谁通过vim编辑过某个文件呢? 那么,有什么办法可以看见这些操作呢,答案是一定有的,具体怎么实现呢,linux script命令正有如此强大的功能,可…
top命令经常用来监控linux的系统状况,比如cpu.内存的使用,程序员基本都知道这个命令,但比较奇怪的是能用好它的人却很少,例如top监控视图中内存数值的含义就有不少的曲解. 本文通过一个运行中的WEB服务器的top监控截图,讲述top视图中的各种数据的含义,还包括视图中各进程(任务)的字段的排序. top进入视图 top视图 01 [top视图 01]是刚进入top的基本视图,我们来结合这个视图讲解各个数据的含义. 第一行: 10:01:23 - 当前系统时间 126 days, 14:2…
1.系统监控 1) 系统监视和进程控制的工具----> Top 与  free      类似于windows的资源管理器.     进程运行的三种状态: tips: 进程(Process)是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位,是操作系统结构的基础. 解释僵尸进程与孤儿进程: 可参考博客:http://blog.csdn.net/l953972252/article/details/51399576 僵尸进程:一个进程使用fork创建子进程,如果子进…
环境: linux系统 tomcat 6.0.24 jdk 1.6 防火墙的问题: 查看防火墙命令:chkconfig --list | grep -i iptables 关闭防火墙命令:/sbin/service iptables stop [root@etl01 bin]# ./shutdown.sh ======shut down tomcat Using CATALINA_BASE: /java/apache-tomcat- Using CATALINA_HOME: /java/apac…
  1.free 显示当前系统未使用的和已使用的内存数目,还可以显示被内核使用的内存缓冲区 -b:以Byte为单位显示内存使用情况: -k:以KB为单位显示内存使用情况: -m:以MB为单位显示内存使用情况: -o:不显示缓冲区调节列: -s<间隔秒数>:持续观察内存使用状况: -t:显示内存总和列   2.df 显示磁盘分区上的可使用的磁盘空间.默认显示单位为KB.可以利用该命令来获取硬盘被占用了多少空间,目前还剩下多少空间等信息. -a或--all:包含全部的文件系统: --block-s…
1.top命令top命令是Linux下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,类似于Windows的任务管理器.下面详细介绍它的使用方法.top - 01:06:48 up 1:22, 1 user, load average: 0.06, 0.60, 0.48Tasks: 29 total, 1 running, 28 sleeping, 0 stopped, 0 zombieCpu(s): 0.3% us, 1.0% sy, 0.0% ni, 98.7% id, 0.0…
1.lsof 简介 lsof 是 Linux 下的一个非常实用的系统级的监控.诊断工具. 它的意思是 List Open Files,很容易你就记住了它是 “ls + of”的组合~ 它可以用来列出被各种进程打开的文件信息,记住:Linux 下 “一切皆文件”, 包括但不限于 pipes, sockets, directories, devices, 等等. 因此,使用 lsof,你可以获取任何被打开文件的各种信息. 只需输入 lsof 就可以生成大量的信息,因为 lsof 需要访问核心内存和各…
1.lsof 简介 lsof 是 Linux 下的一个非常实用的系统级的监控.诊断工具. 它的意思是 List Open Files,很容易你就记住了它是 "ls + of"的组合~ 它可以用来列出被各种进程打开的文件信息,记住:linux 下 "一切皆文件", 包括但不限于 pipes, sockets, directories, devices, 等等. 因此,使用 lsof,你可以获取任何被打开文件的各种信息. 只需输入 lsof 就可以生成大量的信息,因为…
原文:https://www.linuxidc.com/Linux/2014-12/110563.htm 目录 (1)系统.任务统计信息:(2)进程. cpu 统计信息:(3)最后两行为内存信息:3.1  实际的程序可用内存数怎么算呢?3.2  程序已用内存数又怎么算呢?3.3  怎么判断系统是否内存不足呢?3.4  buffer 与cache 的区别(4)进程信息区:(5)查看指定列5.1 f 键选择显示内容5.2 o 键改变显示顺序5.3 F/O 键将进程按列排序(6)常用交互命令(7)最后…
iotop命令 iotop命令是一个用来监视磁盘I/O使用状况的top类工具.iotop具有与top相似的UI,其中包括PID.用户.I/O.进程等相关信息.Linux下的IO统计工具如iostat,nmon等大多数是只能统计到per设备的读写情况,如果你想知道每个进程是如何使用IO的就比较麻烦,使用iotop命令可以很方便的查看. iotop使用Python语言编写而成,要求Python2.5(及以上版本)和Linux kernel2.6.20(及以上版本).iotop提供有源代码及rpm包,…
记录一下自己常用的linux系统命令,方便以后查阅,发觉记忆越来越不行了 找到最耗CPU的java线程 ps命令 命令: ps -mp pid -o THREAD,tid,time 或者 ps -Lfp pid 结果展示: 这个命令的作用,主要是可以获取到对应一个进程下的线程的一些信息. 比如你想分析一下一个java进程的一些运行瓶颈点,可以通过该命令找到所有当前Thread的占用CPU的时间,也就是这里的最后一列. 比如这里找到了一个TID : 30834 ,所占用的TIME时间最高. 通过…
vmstat的官方定义是:vmstat - Report virtual memory statistics,即虚拟内存的统计. 先来追根溯源: 什么是虚拟内存? 答:虚拟内存就是磁盘上虚拟出来可以当内存使用的一个文件 为什么要有虚拟内存? 答:程序需要经由内存来运行,如果程序执行时占用内存过多,内存耗尽,就会影响程序运行,在这种情况下,虚拟内存就会站出来——调用硬盘空间来充当内存,缓解内存紧张的状态,使程序顺利的运行下去.但是经由硬盘的读取远不如直接从内存来读取的效率高(所以有条件的话多买点内…