记一个有趣的Java OOM!
原文:https://my.oschina.net/u/1462914/blog/1630086
引言
熟悉Java的童鞋,应该对OOM比较熟悉。该类问题,一般都比较棘手。因为造成此类问题的原因有很多。今天就分享一个非常有意思的案例。(说实话。这个问题,我也是前两天才遇到的。花了不少时间来分析。觉得非常有意思,记录在此。大神勿喷!)
问题场景
重启应用时,调试到给MQ发消息时。有如下错误:
Exception in thread "Thread-4" java.lang.OutOfMemoryError: unable to create new native thread
at java.lang.Thread.start0(Native Method)
at java.lang.Thread.start(Thread.java:717)
at java.util.concurrent.ThreadPoolExecutor.addWorker(ThreadPoolExecutor.java:957)
at java.util.concurrent.ThreadPoolExecutor.execute(ThreadPoolExecutor.java:1378)
at org.apache.activemq.thread.PooledTaskRunner.wakeup(PooledTaskRunner.java:81)
at org.apache.activemq.transport.failover.FailoverTransport.reconnect(FailoverTransport.java:757)
at org.apache.activemq.transport.failover.FailoverTransport.start(FailoverTransport.java:344)
at org.apache.activemq.transport.TransportFilter.start(TransportFilter.java:58)
at org.apache.activemq.transport.TransportFilter.start(TransportFilter.java:58)
一开始,以为是系统磁盘,或者内存占满导致。通过top
命令查看系统信息。均属于正常范围。正在尝试寻找其他方案的同时。在SSH中输入命令是。出现以下错误:
$ bash: fork: Resource temporarily unavailable
出现上述问题后:非常明显的提示来资源不足导致。
经分析:是由于当前系统使用的线程数大于ulimit中的max_user_processes的数量导致。
Linux ulimit 参数
上面说到了,与系统(Linux)中的ulimit参数有关。ulimit 是用来限制系统资源的。
其中包括:
max memory size (最大内存大小)。
open files(打开文件数)。
max user processes(最大用户进程数)
等等。
系统性能优化常常会优化此参数。
(有兴趣的童鞋可以自行了解更多)
ulimit 常用命令:
1. 显示open files
$ ulimit -n
65535
其中 ulimit -n 显示的结果为: open files的数值。
2. 显示当前用户的最大进程数
$ ulimit -u
60000
其中ulimit -u 显示的结果为: max_user_processes额值。
2. 显示ulimit 所有属性
$ ulimit -a
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) 127399
max locked memory (kbytes, -l) 64
max memory size (kbytes, -m) unlimited
open files (-n) 65535
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 10240
cpu time (seconds, -t) unlimited
max user processes (-u) 60000
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
其中:
open files 表示打开文件的最大数。
max user processes 当前用户打开能打开的最大进程数。
(一) 修改 open files 数量
其中open files 属性, 可以在/etc/security/limits.conf
文件中修改。在文件末尾添加。如下所示代码:
* soft nofile 65535
* hard nofile 65535
其中:
nofile 表示 open files
nproc 对应的属性为: max_user_processes
其中 65535 为演示数字。请按照环境的实际情况进行调整。
(二) 修改 max_user_processes 数量
其中 max_user_processes属性,可以在/etc/security/limits.d/90-nproc.conf
路径下进行修改。
修改如下:
* soft nproc 60000
root soft nproc unlimited
需要注意的是:
max_user_processes中最大的值为: 60000。
如果设置超过60000,则默认为最大值。例如: 设置 655535,则会为60000。执行上述步骤后。退出当前会话。重新连接即可生效!在修改之前连接的会话,需要重新连接,才能看到新的配置。
查看系统资源方法
1. 查看当前系统使用的进程数。
我们可以使用: ps aux|wc -l
或者ps -ef|wc -l
命令来查看当前正在使用的进程数。
如下所示:
$ ps aux|wc -l
309
有时通过ps aux|wc -l
命令查看得到的数据少于max_user_processes
的值。
也出现:
$ bash: fork: Resource temporarily unavailable`
这是因为一个进程中可以包含多个线程导致。
2. 查看指定进程数中的线程数。
当我们知道了的进程ID(PID)后,
也可以通过如下方法查看当前进程中有多少个线程:
命令:
$ cat /proc/<pid>/status
案例如下:
andy@andyqian:/java$ cat /proc/11723/status
Name: java
State: S (sleeping)
Tgid: 11723
Ngid: 0
Pid: 11723
PPid: 2434
TracerPid: 0
Uid: 1000 1000 1000 1000
Gid: 1000 1000 1000 1000
FDSize: 128
Groups: 4 24 27 30 46 108 124 1000
Threads: 28
SigQ: 0/47456
Seccomp: 0
Cpus_allowed: ff
Cpus_allowed_list: 0-7
Mems_allowed: 00000000,00000001
Mems_allowed_list: 0
voluntary_ctxt_switches: 88
nonvoluntary_ctxt_switches: 3
其中:
Threads:28 就表示该进程中,一个有28个线程。
由于篇幅原因,以上删除了部分信息。
3. 如何查看应用的进程 可能有童鞋不知道如何查看应用的进程数,这里给个简单的案例:
例如查看一个名命为tomcat01
的tomcat。我们可以通过如下命令查看:
ps -aux|grep tomcat01
如下所示:
andy@andyqian:/java$ ps -aux|grep tomcat01
andy 11723 0.5 1.0 6484560 127292 pts/1
其中: 11723 对应的就是tomcat01的进程ID。
记一个有趣的Java OOM!的更多相关文章
- salesforce零基础学习(一百一十五)记一个有趣的bug
本篇参考:https://help.salesforce.com/s/articleView?language=en_US&type=1&id=000319486 page layou ...
- 【bug】记一个有趣的“bug”
产品经理在使用我们用户功能的是,需要查询一个用户,知道这个用户的id,我说支持模糊查询的. 他输入"余XX",点击查询,怎么都查不出这个用户. 我到用户表里确认,确实有这个ID的用 ...
- 记一个社交APP的开发过程——基础架构选型(转自一位大哥)
记一个社交APP的开发过程——基础架构选型 目录[-] 基本产品形态 技术选型 最近两周在忙于开发一个社交App,因为之前做过一点儿社交方面的东西,就被拉去做API后端了,一个人头一次完整的去搭这么一 ...
- dubbo debug过程中一个有趣的问题
最近在debug dubbo代码过程中遇到的很有趣的问题 我们都知道dubbo ReferenceBean是消费者的spring bean包装,为了查一个consumer端的问题,在Reference ...
- Java OOM 常见情况
Java OOM 常见情况 原文:https://blog.csdn.net/qq_42447950/article/details/81435080 1)什么是OOM? OOM,全称“Out Of ...
- Java OOM学习
转载自原文: 什么是java OOM?如何分析及解决oom问题? 什么是OOM? OOM,全称"Out Of Memory",翻译成中文就是"内存用完了",表现 ...
- 举一个有趣的例子,让你轻松搞懂JVM内存管理
目录 前言 例子 源码 输出 图解 深入分析 学以致用 写在最后 前言 在JAVA虚拟机内存管理中,堆.栈.方法区.常量池等概念经常被提到,对理论知识的理解也常常停留在字面意思上,比如说堆内存中存放对 ...
- 怒肝俩月,新鲜出炉史上最有趣的Java小白手册,第一版,每个 Java 初学者都应该收藏
这么说吧,在我眼里,Java 就是最流行的编程语言,没有之一(PHP 往一边站).不仅岗位多,容易找到工作,关键是薪资水平也到位,不学 Java 亏得慌,对吧? 那可能零基础学编程的小伙伴就会头疼了, ...
- Linux环境下部署完JDK后运行一个简单的Java程序
前言 前一篇文章详细讲解了如何在Windows环境下安装虚拟机+Linux系统,并且成功部署了JDK. 不过部署完JDK之后,我们判断部署是否成功的依据是看"java -version&qu ...
随机推荐
- mssql批量刷新多个表的数据
DECLARE @SQL VARCHAR(MAX)SELECT @SQL=ISNULL(@SQL,'')+' UPDATE '+NAME+' SET B=3 WHERE B=2'FROM SYSOBJ ...
- https配置注意细节
直接将阿里云https的ca配置配置好之后如果不通的话很有可能是防火墙原因造成的,还有就是nginx要用1.10以上版本的
- javascript 线程问题小记
大家都知道javascript是单线程执行的,alert之后,就无法执行以下的函数,浏览器是按照从上到下的顺序来安排解析显示的. 其实虽然javascript是单线程的,但是浏览器是多线程的,典型的浏 ...
- 【DUBBO】dubbo的Router接口
Router服务路由, 根据路由规则从多个Invoker中选出一个子集AbstractDirectory是所有目录服务实现的上层抽象, 它在list列举出所有invokers后,会在通过Router服 ...
- [loj#2566][BZOJ5333] [Sdoi2018]荣誉称号 树形dp
#2566. 「SDOI2018」荣誉称号 休闲游戏玩家小 Q 不仅在算法竞赛方面取得了优异的成绩,还在一款收集钻石的游戏中排名很高. 这款游戏一共有 n 种不同类别的钻石,编号依次为 1 到 n ...
- (翻译)与.NET容器映像保持同步
原文:https://blogs.msdn.microsoft.com/dotnet/2018/06/18/staying-up-to-date-with-net-container-images/ ...
- Laravel5中的Session
有关Session的配置文件是aonfig/session.PHP文件. 如果不使用基于数据库.cookie或者Redis缓存类的Session的话,不需要改配置文件就可以使用了. 下面一个简单的使用 ...
- 234. Palindrome Linked List【Easy】【判断链表是否回文】
Given a singly linked list, determine if it is a palindrome. Example 1: Input: 1->2 Output: false ...
- 字符串匹配&Rabin-Karp算法讲解
问题描述: Rabin-Karp的预处理时间是O(m),匹配时间O( ( n - m + 1 ) m )既然与朴素算法的匹配时间一样,而且还多了一些预处理时间,那为什么我们还要学习这个算法呢?虽然Ra ...
- Flask实战第46天:完成前台登录功能
后台逻辑 首先进行表单验证, 编辑front.froms.py ... class SignInForm(BaseForm): telephone = StringField(validators=[ ...