运维过程中经常碰见文件系统inodes使用率过高导致文件系统不可写的问题,常见场景如下 .Oracle产生的审计文件,特别是DG备库或者审计设置为OS时 .crontab产生大量邮件,导致/var/spool/postfix/maildrop下大量小文件 普通删除文件 find /var/spool/postfix/maildrop/ -type f |xargs rm -rf ##crontab添加参数,避免产生mail crontab -e : 添加MAILTO="" ##重启:…
kubelet CPU 使用率过高问题排查 问题背景 客户的k8s集群环境,发现所有的worker节点的kubelet进程的CPU使用率长时间占用过高,通过pidstat可以看到CPU使用率高达100%.针对此问题对kubelet进程的异常进行问题排查. 集群环境 软件 版本 kubernetes v1.18.8 docker 18.09.9 rancher v2.4.8-ent CentOS 7.6 kernel 4.4.227-1.el7.elrepo.x86_64 排查过程 使用strac…
AIX操作系统中Paging Space是很重要的设备,当系统中Paging Space使用率过高.系统内存不足时,将影响系统的整体性能,甚至会造成系统的挂起.针对这种情况,通常可以靠增加Paging Space来加以缓解:但是当Paging Space已经相当大,而Paging Space使用率仍旧居高不下时,则需要通过进一步的分析来找出原因并加以解决.文中分析了几种Paging Space使用率持续增长直至过高的常见原因,并给出了相应的解决方案,以确保Paging Space使用率被控制在安…
发现服务器的cpu使用率特别高 排查思路: -使用top或者mpstat查看cpu的使用情况# mpstat -P ALL 2 1Linux 2.6.32-358.el6.x86_64 (linux—host) 01/05/2016 _x86_64_ (24 CPU) 04:41:13 PM CPU %usr %nice %sys %iowait %irq %soft %steal %guest %idle04:41:15 PM all 0.56 0.00 0.25 0.00 0.00 0.04…
<Troubleshooting SQL Server>读书笔记-CPU使用率过高(下) 第三章 High CPU Utilization. CPU使用率过高的常见原因 查询优化器会尽量从CPU,IO和内存资源成本最小的角度,找到最高效的数据访问方式.如果没有正确的索引,或者写的语句本身就会忽略索引, 又或者不准确的统计信息等情况下,查询计划可能不是最优的. 有些查询计划可能对只对某种条件下的查询是高效,而不是所有条件下都是. 缺失索引 索引的缺失,会导致查询处理的行数大大超出必要的行数,从而…
解决此问题的关键在于如何找到造成CPU使用率过高的SQL语句.步骤如下: 1.使用Process Explorer工具查看到Oracle进程,双击Oracle进程,在弹出的属性窗口的Threads选项卡中查看占用CPU较高的线程号(TID). 2.在PL/SQL工具中执行以下SQL语句: --根据sql_id获取对应的Sql语句(sql_text,sql_fulltext)select * from v$sqlarea where sql_id in ( --根据addr获取sql_id sel…
Java程序CPU使用率过高 通过top命令找到使用率过高的java进程PID 根据进程号查找线程TID:ps -mp PID -o THREAD,tid,time 将TID转换成16进制:printf "%x\n" TID 通过jstack命令查看进程栈信息:jstack PID |grep TID16 -A 100 注:jstack命令包含在oracle-jdk中 openjdk不包含此命令…
1.某日zabbix告警,某台机器CPU使用率过高. 查看慢查询日志,看到很多sql语句都超过10秒 把sql语句拿出来放在查询窗口执行.前面加上explain就可以查看详细查询信息 playcode字段没设置索引导致每次查询都执行了全表扫描 通过加入explain可以看到它查询遍历了多少行 下面是我随便找一个语句查询的. 当时告警时忘记截图了.实际查询全表扫描了.有50万行.肯定很慢 加索引…
项目过程中发现,应用服务器经常会出现CPU使用率较高的情况,需要定位出具体代码问题. 1.用top命令,根据CPU使用率排序,找出消耗cpu最高的进程 2.找出该进程下消耗CPU最高的线程(命令:top -Hp pid) 3.将该进程转换成16进制 4.用jstack去dump线程栈(命令:jstack 进程|grep 16进制线程) 就是这个对象造成的用户CPU使用过高,具体根据这个对象去找对应的代码就行,或者把这个对象告诉开发,开发知道怎么去找对应的代码.…
第三章 High CPU Utilization. CPU使用率过高问题很容易被发现,但是诊断却不是很容易.CPU使用过高很多时候会成为其它问题的替罪羊,所以在确认和故障诊断时要抽丝剥茧. 调查CPU压力 三个主要的工具:性能监视器,SQLTrace,DMV. 性能监视器:首先用它来确认是SQL Server还是其它进程使用了过多的CPU.主要计数器有: Processor/ %Privileged Time :在特权模式下进程线程执行代码所花时间的百分比.基本可以认为是Windows核心使用的…
AIX 中 Paging Space 使用率过高的分析与解决 原文:https://www.ibm.com/developerworks/cn/aix/library/au-cn-pagingspace/index.html AIX操作系统中Paging Space是很重要的设备,当系统中Paging Space使用率过高.系统内存不足时,将影响系统的整体性能,甚至会造成系统的挂起.针对这种情况,通常可以靠增加Paging Space来加以缓解:但是当Paging Space已经相当大,而Pag…
业务背景 业务背景就是需要将多张业务表中的数据增量同步到一张大宽表中,后台系统基于这张大宽表开展业务,所以就开发了一个数据同步工具,由中间件采集binlog消息到kafka里,然后我去消费,实现增量同步. 生产环境发现的现象 在程序发布到生产环境时候,机器的CPU使用率立马被打到100%, load还在不停的上升,开始机器的配置是4核心8G内存,load可以到21,通过topc命令查看load average的三个值都大于20,说明机器非常的繁忙. 排查步骤及手段 1.  通过top命令查看到C…
mysql cpu使用率过高解决方法 1 mysql查看正在运行的语句 并且查看运行最多的mysql语句 MySQL 打开 general log 后,所有的查询语句都会记录在 general log 文件,文件为只读方式,但这样general log文件会非常大,所以默认是关闭的.但有时需要查错等原因,暂时需要打开general log.打开方法: select version();//我的是5.6是支持一个日志的开启. set global general_log=1;//开启查询日志 se…
一个应用占用CPU很高,除了确实是计算密集型应用之外,通常原因都是出现了死循环. 下面我们将一步步定位问题,详尽的介绍每一步骤的相关知识. 一.通过top命令定位占用cpu高的进程 执行top命令得到以下结果: top命令查询结果 通过上图可以明显看出进程PID41843占用cpu过高,明显存在问题,定位到了进程id.当然如果你想只观察进程PID41843的CPU和内存以及负载情况,可以使用以下命令 top -p 41843 结果如下: top -p 41843命令执行结果 这里顺便解释下上图各…
11G Undo使用率很高问题 http://blog.itpub.net/12679300/viewspace-1164916/ 原创 Oracle 作者:wzq609 时间:2014-05-20 10:23:29  2623  0 事件背景: 公司的ERP数据库是11.2.0.3的版本,最近观察到一个奇怪的现象就是数据库的UNDO表空间的使用率一直居高不下:UNDO表空间的大小为76G,但是使用率一直保持着70%以上.      趁此机会又重新学习了一遍Undo的知识,最终解决了这个问题,以…
Linux 系统下 cpu 使用率过高的分析方法 1.通过 top 命令可以很明显查看出哪个进程耗cpu比较高 2. ps -mp 25147-o THREAD,tid,time\top -Hp pid找到耗时最高的线程 或者使用:使用 top -H -p <pid> 查看进程里面的线程占用情况 或者在top命令之后使用:shift+h  查看哪个进程程消耗最高 3,将需要的线程ID转换为16进制格式 , 打印堆栈信息sudo jstack 25147|grep 6268 jstack 388…
系统环境: Windows Server 2008 R2 Enterprise 搭建有 web服务器(iis) 和  文件服务   问题描述: Windows Server 2008 R2系统内存耗光(64G,占用63.3G),而在任务管理器中各进程内存占用总和都远不到此占用率. 参考: Windows Server 2008 R2服务器内存使用率过高,但与任务管理器中进程占用内存和不一致 Windows Server 2008 MetaFile设置占用内存限制 实测:启用Dynamic Cac…
上一节我讲了 CPU 使用率是什么,并通过一个案例教你使用 top.vmstat.pidstat 等工具,排查高 CPU 使用率的进程,然后再使用 perf top 工具,定位应用内部函数的问题.不过就有人留言了,说似乎感觉高 CPU 使用率的问题,还是挺容易排查的. 那是不是所有 CPU 使用率高的问题,都可以这么分析呢?我想,你的答案应该是否定的. 回顾前面的内容,我们知道,系统的 CPU 使用率,不仅包括进程用户态和内核态的运行,还包括中断处理.等待 I/O 以及内核线程等.所以,当你发现…
小结 碰到常规问题无法解释的 CPU 使用率情况时,首先要想到有可能是短时应用导致的问题,比如有可能是下面这两种情况. 第一,应用里直接调用了其他二进制程序,这些程序通常运行时间比较短,通过 top 等工具也不容易发现. 第二,应用本身在不停地崩溃重启,而启动过程的资源初始化,很可能会占用相当多的 CPU. 对于这类进程,我们可以用 pstree 或者 execsnoop 找到它们的父进程,再从父进程所在的应用入手,排查问题的根源. 如果碰到不好解释的CPU问题时,比如现象:通过top观察CPU…
tomcat要运行依赖于JDK,tomcat服务器的CPU使用率过高,大多都是因为部署的web程序的问题. 一.现象描述 在一次线上环境,前台访问页面的速度越来越慢,从浏览器F12中看到发出的请求都是pengding的状态. 二.排查过程 我这里tomcat部署在linux环境中.下面的排查过程均在linux下进行. 1.排查后台服务 查看tomcat的后台日志,发现日志正常打印,未发现异常信息:把要执行的SQL复制出来,放到mysql的客户端执行,发现sql运行正常且查询速度正常. 通过上面的…
性能分析小案例系列,可以通过下面链接查看哦 https://www.cnblogs.com/poloyy/category/1814570.html 系统架构背景 VM1:用作 Web 服务器,来模拟性能问题 VM2:用作 Web 服务器的客户端,来给 Web 服务增加压力请求 使用两台虚拟机(均是 Ubuntu 18.04)是为了相互隔离,避免交叉感染 VM2 运行 ab 命令,初步观察 Nginx 性能 简单介绍 ab 命令 ab(apache bench)是一个常用的 HTTP 服务性能测…
性能分析小案例系列,可以通过下面链接查看哦 https://www.cnblogs.com/poloyy/category/1814570.html 前言 前面两个案例讲的都是上下文切换导致的 CPU 使用率升高 这一篇就来讲讲等待 I/O 导致的 CPU 使用率升高的案例 进程状态 详解进程状态 https://www.cnblogs.com/poloyy/p/13413770.html 不可中断状态 当 iowait 升高时,进程很可能因为得不到硬件的响应,而长时间处于不可中断状态 不可中断…
性能分析小案例系列,可以通过下面链接查看哦 https://www.cnblogs.com/poloyy/category/1814570.html 前言 软中断基本原理,可参考这篇博客:https://www.cnblogs.com/poloyy/p/13435519.html 中断 一种异步的事件处理机制,用来提供系统的并发处理能力 当中断事件发生,会触发执行中断处理程序 中断处理程序分为上半部和下半部 上半部:硬中断,快速处理中断 下半部:软中断,用来异步处理上半部未完成的工作 软中断 每…
上一节讲了 CPU 使用率是什么,并通过一个案例教你使用 top.vmstat.pidstat 等工具,排查高 CPU 使用率的进程,然后再使用 perf top 工具,定位应用内部函数的问题.不过就有人留言了,说似乎感觉高 CPU 使用率的问题,还是挺容易排查的.那是不是所有 CPU 使用率高的问题,都可以这么分析呢?我想,你的答案应该是否定的. 回顾前面的内容,我们知道,系统的 CPU 使用率,不仅包括进程用户态和内核态的运行, 还包括中断处理.等待 I/O 以及内核线程等.所以,当你发现系…
用户在使用 MySQL 实例时,会遇到空间使用告警甚至超过实例限额被锁定的情况.在 RDS 控制台的实例基本信息中,即会出现如下信息: 本文将介绍造成空间使用率过高的常见原因及其相应的解决方法.对于MySQL 5.6版本的实例,升级实例规格和存储空间后即可解锁实例,关于如何升级实例配置,请参见变更配置. 常见原因 造成 MySQL 实例空间使用率过高,主要有如下四种原因: Binlog 文件占用高. 数据文件占用高. 临时文件占用高. 系统文件占用高. 查看空间使用状况 您可以通过 DMS 中的…
如何让Linux 机器CPU使用率变高 一.实现 1.单行命令搞定 for i in `seq 1 $(cat /proc/cpuinfo |grep "physical id" |wc -l)`; do dd if=/dev/zero of=/dev/null & done 2.脚本方法 makeLoveCPU.sh for i in `seq 1 $(cat /proc/cpuinfo |grep "physical id" |wc -l)`; do d…
实际上前文中关于CPU使用率过高如何通过各种工具获得相关的热点进程.那么进程有了,那得疑惑到底哪个哪段代码导致了这个进程成为热点呢? 如果在调试阶段,可以使用gdb中断运行,但是在生产环境肯定不行.Linux提供了一个工具perf. 安装它即可,然后man perf查看其使用说明. 常用的一种,统计分析结果输出到屏幕:perf top symbol列下即为待选的热点函数. 第二种常见用法,也就是 perf record 和 perf report. perf top 虽然实时展示了系统的性能信息…
FastDFS是用C语言编写的一款开源的轻量级分布式文件系统.它对文件进行管理,功能包括:文件存储.文件同步.文件访问(文件上传.文件下载)等,解决了大容量存储和负载均衡的问题.特别适合以文件为载体的在线服务,如相册网站.视频网站等等. FastDFS为互联网量身定制,充分考虑了冗余备份.负载均衡.线性扩容等机制,并注重高可用.高性能等指标,使用FastDFS很容易搭建一套高性能的文件服务器集群提供文件上传.下载等服务. 与Hadoop有什么区别? Hadoop也是一个分布式文件系统,hadoo…
原文:https://blog.markvincze.com/troubleshooting-high-memory-usage-with-asp-net-core-on-kubernetes/ ps:我不是死板翻译原文的,尽量的通俗一点,如有不对欢迎指出,谢谢哈. 在生产环境中,我们把asp.net core api应用通过Kubernetes 部署在了Google Cloud (GCE—Google Container Engine).我们发现大多数的组件(core应用)的内存使用率都不合理…
1.在编写程序中有时候设置不恰当,休眠时间不够,一般情况下4核的电脑CPU使用率一直大于23%,8核的大于13%就有可能是这种情况 解决方法: 在VS查看并行线程利用CPU使用工具ProcessExplorer,查看CPU占用率过高的线程查看线程ID 和 并行线程ID 相同的然后仔细看那个并行线程的代码 2. 查看代码中是否有死锁的部分,死循环或者是耗时代码,一些需要托管在其它硬件执行的程序 3.其它: 硬件原因:散热不良,驱动问题 病毒爬虫等外界恶意软件: 重复调用一个进程而没有结束:…