背景 运维人员反馈一个容器化的java程序每跑一段时间就会出现OOM问题,重启后,间隔大概两天后复现. 问题调查 一查日志 由于是容器化部署的程序,登上主机后使用docker logs ContainerId查看输出日志,并没有发现任何异常输出. 使用docker stats查看容器使用的资源情况,分配了2G大小,也没有发现异常. 二缺失的工具 打算进入容器内部一探究竟,先使用docker ps 找到java程序的ContainerId ,再执行docker exec -it Container…