最近在生产环境遇到一个问题,正常情况下,ECS CPU始终保持在10%以下,内存也只占用40%左右,但是连续2天出现了CPU占用100%的情况,然后系统卡住.看阿里云的ECS监控,能看到CPU飙到了100%. 再去查日志,发现了有内存溢出的错误GC overhead limit exceeded 这个异常是GC在尝试多次回收后,都回收了不到2%才抛出.一直尝试回收,却一直回收不到2%形成了恶性循环,导致CPU也飙到100%.可以肯定的是一定触发了什么操作才导致这种情况的发生.但是日志当中又看不到…