揭秘JAVA JVM内幕

在之前的文章一步步解析java执行内幕中，比较详细分析了java代码是如何一步一步在jvm中执行的，然而设计的的jvm核心技术点，并未做深入分析，本篇文章将重点分析jvm，涉及到的内容包括jvm内存模型，类加载器，GC回收算法，GC回收器，整体偏向于理论。

本篇文章不适合初学者，适合具有3年以上开发经验的技术人员，欢迎大家一起交流分享，文章若有不足之处，欢迎读者朋友们指出，先感谢。

一明确jdk，jre和jvm之间关系

下图为官网关于jdk，jre和jvm的架构图，从该架构图，很容易看出三者之间关系：

(1)jdk包含jre,而jre又包含jvm

(2)jdk主要用于开发环境，jre主要用于发布环境，当然，发布环境用jdk也没问题，仅仅是性能可能会有点影响，jdk与jre关系有点类似程序debug版本和release版本之间关系

(3)从文件大小来说，jdk比jre大。从图中可以看出，jdk比jre多了一层工具包，如常用的javac，java命令等

二类加载器

关于jvm类加载器，可概括为如下图：

1.为什么要有类加载器？

(1)将字节码文件加载到运行时数据区。.java源码通过Javac命令编译后形成的字节码文件(.class)，通过类加载器加载进入jvm中的。

(2)确定字节码文件在运行时数据区的唯一性。相同的字节码文件，通过不同的类加载器，就形成不同的文件，因此字节码文件在运行时数据区的唯一性是由字节码文件和加载它的类加载器共同决定的

2.类加载器的种类

从种类上来划分，类加载器主要划分为四大类

(1)启动类加载器 (根类加载器Bootstrap ClassLoader)：该类加载器位于类加载器的最顶层，主要加载jre核心相关jar包，如 /jre/lib/rt.jar

(2)扩展类加载器(Extension ClassLoader):该类加载器位于类加载器层次的第二层，主要加载 jre扩展相关jar包，如/jre/lib/ext/*.jar

(3)应用程序类加载器(Application ClassLoader) App:该类加载器位于类加载器的第三层，主要加载类路径(classpaht)下的相关jar包

(4)用户自定义类加载器(User ClassLoader):该类加载器为用户自定义类加载器，主要加载用户指定的路径下的相关jar包

3.类加载器的机制(双亲委派)

对于字节码的加载，类加载机制为双亲委派，什么叫双亲委派呢？

类加载器获取字节码文件后，不是直接加载，而是将该字节码文件传递给其直接父级类加载器，其直接父加载器又继续传递给其直接父加载器的直接父加载器，依次类推到根父加载器，若根父加载器

能加载，则加载，否则交给其直接孩子加载器加载，直接孩子加载器能加载就加载，若不能，依次类推其直接孩子类加载器，若都不能加载，最后才由用户自定义类加载器加载。

4.jdk 1.8 如何实现类加载器？

如下为jdk 1.8 类加载器的实现，采用递归方式

protected Class<?> loadClass(String name, boolean resolve)

        throws ClassNotFoundException

    {

        synchronized (getClassLoadingLock(name)) {

            // First, check if the class has already been loaded

            Class<?> c = findLoadedClass(name);

            if (c == null) {

                long t0 = System.nanoTime();

                try {

                    if (parent != null) {

                        c = parent.loadClass(name, false);

                    } else {

                        c = findBootstrapClassOrNull(name);

                    }

                } catch (ClassNotFoundException e) {

                    // ClassNotFoundException thrown if class not found

                    // from the non-null parent class loader

                }

                if (c == null) {

                    // If still not found, then invoke findClass in order

                    // to find the class.

                    long t1 = System.nanoTime();

                    c = findClass(name);

                    // this is the defining class loader; record the stats

                    sun.misc.PerfCounter.getParentDelegationTime().addTime(t1 - t0);

                    sun.misc.PerfCounter.getFindClassTime().addElapsedTimeFrom(t1);

                    sun.misc.PerfCounter.getFindClasses().increment();

                }

            }

            if (resolve) {

                resolveClass(c);

            }

            return c;

        }

    }

5.破坏双亲委派模型

在某些情况下，由于受加载范围限制，父类加载器无法加载到需要的文件，因此父类加载器需要委托其子类加载器去加载相应的字节码文件。

如在jdk中定义的数据库驱动接口Driver，但该接口的实现却由不同的数据库厂商来实现，这就产生这样一个问题：由启动类(Bootstrap ClassLoader)

执行的DriverManager要加载实现了Driver接口的相关实现类，从而实现统一管理，但Bootstrap ClassLoader只能加载jre/lib下的相应文件，不能加载

由各个厂商实现的Dirver接口相关实现类(Dirver实现类是由Application ClassLoader加载)，这时就需要Bootstrap ClassLoader委托其子类加载器加载Driver

来实现，从而破坏了双亲委派模型。

三类的生命周期

java中的类，在jvm中的生命周期，大概分为五个阶段：

1.加载阶段：获取字节码二进制流，并将静态存储结构转化成方法区的运行时数据结构，且在方法区生成相应的类对象(java.lang.Class对象)，作为该类的数据访问入口。

2.连接阶段：该阶段包括三个小阶段，即验证，准备和解析三阶段

(1)验证：确保字节码文件符合虚拟机规范要求，如元数据验证，文件格式验证，字节码验证和符号验证等

(2)准备：为内的静态表里分配内存，并且设置jvm默认值，对于非静态变量，此阶段，不需分配内存。

(3)解析：将常量池内的符号引用转化为直接引用

3.初始化阶段：类对象使用前的一些必要初始化工作

如下引用自一位博友的观点，个人认为解释得很好。

在 Java 代码中，如果要初始化一个静态字段，我们可以在声明时直接赋值，也可以在静态代码块中对其赋值。

除了 final static 修饰的常量，直接赋值操作以及所有静态代码块中的代码，则会被 Java 编译器置于同一方法中，并把它命名为 < clinit > 。初始化的目的是是为标记为

常量值的字段赋值，以及执行< clinit > 方法的过程。Java 虚拟机会通过加锁来确保类的 < clinit > 方法仅被执行一次。

哪些条件会发生类初始化呢？

(1)当虚拟机启动时，初始化用户指定的主类（main函数）；

(2)当遇到用于新建目标类实例的 new 指令时，初始化 new 指令的目标类；

(3)当遇到调用静态方法的指令时，初始化该静态方法所在的类；

(4)子类的初始化会触发父类的初始化；

(5)如果一个接口定义了 default 方法，那么直接实现或者间接实现该接口的类的初始化，会触发该接口的初始化；

(6)使用反射 API 对某个类进行反射调用时，初始化这个类；

(7)当初次调用 MethodHandle 实例时，初始化该 MethodHandle 指向的方法所在的类。

4.使用阶段：jvm中使用对象

5.卸载阶段：将对象从jvm中卸载(unload)，哪些条件会使jvm发生类卸载呢？

(1)加载该类的类加载器被回收

(2)该类的所有实例已经被回收

(3)该类对应的java.lang.Class对象没有任何地方被引用

四 jvm内存模型

1.JVM内存模型是怎样的？

如下为JVM内存模型架构图，由于在之前的文章中论述过，这里就不再一一论述，主要讲解堆区。

在jdk 1.8前，堆区主要分为新生代、老年代和永久代。jdk 1.8后，去掉了永久代，增加了MetaSpace区。这里，主要分享jdk 1.8。

根据jdk1.8，堆区逻辑抽象为三个部分：

(1)新生代:包括Eden区，S0区(也叫from区)，S21(也叫TO区)

(2)老年代

(3)Metaspace区

2.新生代和老年代的内存大小是怎样的？

根据官方建议，新生代占三分之一(Eden:S0:S1=8:1:1)，老年代占三分之二，因此内存分配图如下：

3.GC回收是怎样进行的？

对象先在Eden区运行，当Eden内存用占用满时，Eden会进行两个操作：回收不用的对象和将未回收对象放入s0区，此时s0区和s1区互唤名称，即s0->s1,s1->s0，Eden区经过一次对象回收后，释放了空间，当Eden下次再满时，执行相同步骤，依次循环执行，当Eden区回收后，剩下的对象超过s0容量，则将出发一次Minor GC,此时将未回收的对象放入老年区，依次循环执行，当Eden区触发Minor GC时，剩余的对象容量大于old区剩余容量时，则old区将触发一次Major GC，此时便会触发一次Full GC。需要注意的是，一般发生Major GC，基本都都会伴随一次Full GC回收，Full GC非常损耗性能，在JVM调优时，要注意。

下图我在生产环境截的一张GC图，监控工具VisualVM

4.垃圾回收算法有哪些？

（1）标记-清除算法

该算法分为2个阶段，即标记阶段和清楚阶段，首先标记所有要回收的对象，然后回收被标记的对象。该算法效率低，且容易产生内存碎片。

a.效率低：需要遍历两次内存，第一次标记，第二次回收被标记对象

b.由于是非连续内存片段，容易产生碎片，当对象过大时，容易发生Full GC

下图为标记-清除算法回收前和回收后对比示意图

（2）标记-复制算法

该算法解决了“标记-清除”算法效率低和大部分内存碎片问题，它将内存分为大小相等的两块，每次只使用其中一块，当其中一块需要回收时，只需将该快区域还存活的对象复制到另一块，然后再把该块内存一次性清理掉，循环往复。

下图为标记-复制算法回收前和回收收简要示意图

然而，由于年轻代大部分对象驻留时间都非常短，98%的对象都很快被回收，存活的对象非常少，不需要按照内存1:1来划分，而是按照8:1:1来划分，

将2%存活的对象放在s0(from区)即可。

如下为按照Eden:s0:s1 =8:1:1 划分示意图

（3）标记-整理算法

该算法分为两阶段，即标记和整理，首先标记所有存活对象，将这些对象向一端移动，然后直接清理掉端边界以外的内存。由于老年代的对象存活时间比较长，因此适合用该算法。

标记过程仍与“标记-清除”过程一致，但后续步骤不是直接对可回收对象进行清理，而是让所有存活对象向一端移动，然后直接清理掉端边界以外的内存。

如下为"标记-整理算法"回收期和回收后示意图

（4）分代收集算法

该算法未目前jvm算法，采用分代思想，模型如下：

5.常见GC回收器有哪些？

（1）SerialGC

SerialGC又叫串行回收器，也是最基础的GC回收器，主要适用于单核cpu，新生代采用复制算法，老年代采用标记-压缩算法，在运行的过程中需要暂停应用程序，

因此会造成STW问题，在JVM标注参数为：-XX:+UseSerialGC 。

（2）ParallelGC

ParallelGC基于SerialGC，主要解决SerialGC串行问题，改为并行问题，解决多线程问题，但同样会产生STW问题，jvm关键参数：

a.-XX:+UseParNewGC，表示新生代并行（复制算法）老年代串行（标记-压缩）

b.XX:+UseParallelOldGC，老年代也是并行

（3）CMS GC

CMSGC属于老年代回收器，采用“标记-清除算法”，不会发生STW问题，在jvm中参数设置：

-XX:+UseConcMarkSweepGC，表示老年代使用CMS收集器

（4）Garbage First

Garbage First面向jvm垃圾收集器，它满足短时间停顿的同时达到一个高的吞吐量，适用于多核cpu和大内存的服务端，也是jdk9的默认垃圾回收器。

五总结

本篇文章在之前文章一步步解析java执行内幕基础上，深入分析了JVM内存模型，其中重点分析了jdk,jre和jvm关系，jvm类加载器，jvm堆内存划分，GC回收器和GC回收算法等，整体偏向于理论，由于篇幅有限，本篇文章未分析这些技术在JVM实际调优中是如何运用的，将在接下来的文章中与大家分享。

揭秘JAVA JVM内幕的更多相关文章

Spark Tungsten揭秘 Day1 jvm下的性能优化
Spark Tungsten揭秘 Day1 jvm下的性能优化今天开始谈下Tungsten,首先我们需要了解下其背后是符合了什么样的规律. jvm对分布式天生支持整个Spark分布式系统是建立在分 ...
Java 授权内幕--转载
在信息安全性领域,授权是世界的的中心,因为它是控制个体(即人.进程和计算机)对系统资源的访问权限的过程.直到最近,在 Java 安全体系结构中相关的问题都是“这段运行中的代码的访问权限是什么?” 随着 ...
Java (JVM) Memory Model – Memory Management in Java
原文地址:http://www.journaldev.com/2856/java-jvm-memory-model-memory-management-in-java Understanding JV ...
JAVA JVM虚拟机选项：Xms Xmx PermSize MaxPermSize 区别
Xms : 是指设定程序启动时占用内存大小.一般该值设置大的会使程序启动快,但是可能会使本机暂时变慢. Xmx : 是指设定程序运行期间最大可占用的内存大小,如果程序运行需要占用更多的内存,超出这个 ...
Java JVM、JNI、Native Function Interface、Create New Process Native Function API Analysis
目录 . JAVA JVM . Java JNI: Java Native Interface . Java Create New Process Native Function API Analys ...
Java多线程学习笔记——从Java JVM对多线程数据同步的一些理解
我们知道在多线程编程中,我们很大的一部分内容是为了解决线程间的资源同步问题和线程间共同协作解决问题.线程间的同步,通俗我们理解为僧多粥少,在粥有限情况下,我们怎么去防止大家有秩序的喝到粥,不至于 ...
Java JVM 多态(动态绑定)
Java JVM 多态(动态绑定) @author ixenos 摘要:绑定.动态绑定实现多态.多态的缺陷.纯继承与扩展接口.向下转型与RTTI 绑定将一个方法的调用和一个方法的主体关联起来,称作( ...
Java JVM 内存泄漏--全解析和处理办法 [ 转载 ]
Java JVM 内存泄露——全解析和处理办法 [转载] @author 小筐子 @address http://www.jianshu.com/p/bf159a9c391a JA ...
Java JVM使用哪种编码格式
Java JVM使用哪种编码格式 A ASCII characters B Unicode characters C Cp1252 D UTF-8 E GBK F GBK2312 答案:B 在J ...

随机推荐

java实现第三届蓝桥杯火柴游戏
火柴游戏 [编程题](满分34分) 这是一个纵横火柴棒游戏.如图[1.jpg],在3x4的格子中,游戏的双方轮流放置火柴棒.其规则是: 不能放置在已经放置火柴棒的地方(即只能在空格中放置). 火柴棒的 ...
Linux 用户管理命令-usermod和chage
usermod和useradd命令的使用相类似,useradd针对的是新创建的用户可以修改他的信息,usermod则可以修改已经存在的用户的信息,选项也基本相同 usermod [选项] 用户名 -L ...
带你学够浪：Go语言基础系列 - 8分钟学控制流语句
★ 文章每周持续更新,原创不易,「三连」让更多人看到是对我最大的肯定.可以微信搜索公众号「后端技术学堂」第一时间阅读(一般比博客早更新一到两篇) " 对于一般的语言使用者来说 ,20% ...
ubuntu18启动zabbix-agent失败/故障记录
故障现象 ubuntu 16 升级18 之后安装了zabbix agent 今天突然agent掉了上去的时候发现报错: 后来打算-c 启动然后发现 /usr/sbin/zabbix_agentd ...
<VCC笔记> 关于Assertion
这篇博客开始介绍VCC的用法,先用简单的例子介绍VCC的基本语法,当然面对更复杂的程序时,VCC也是将他简化然后分析的. 1.Assertion #include <vcc.h> int ...
Excel常用公式大全
公式是单个或多个函数的结合运用. AND “与”运算,返回逻辑值,仅当有参数的结果均为逻辑“真(TRUE)”时返回逻辑“真(TRUE)”,反之返回逻辑“假(FALSE)”. 条件判断 AVERAGE ...
Android使用OkHttp实现登录注册功能
客户端在客户端,这里将登录和注册放在了同一个界面,在账号和密码两个EditText中输入内容后,按下LOGIN按钮,进行登录:按下REGISTER按钮,进行注册. 在写代码之前,先添加OkHttp的 ...
GitHub 热点速览 Vol.24：程序员自我增值，优雅赚零花钱
摘要:升职加薪,出任 CTO,迎娶白富美/高帅富,走向人生巅峰是很多人的梦想.在本期的热点速览中你将了解自由作者 Easy 如何优雅赚取零花钱的方法,以及定投改变命运 -- 让时间陪你慢慢变富.说到程 ...
WPF入门（2）——依赖属性
今天我们说说依赖属性什么是依赖属性? 当然,学术定义依旧Please Baidu:https://baike.baidu.com/item/%E4%BE%9D%E8%B5%96%E5%B1%9E%E ...
百度文本编辑器的toolbars属性值描述
toolbars: [ [ 'anchor', //锚点 'undo', //撤销 'redo', //重做 'bold', //加粗 ...

揭秘JAVA JVM内幕

揭秘JAVA JVM内幕的更多相关文章

随机推荐

热门专题