在上一篇文章中,我们详细的介绍了Java类文件结构,那么这些Class文件是如何被加载到内存,由虚拟机来直接使用的呢?这就是本篇博客将要介绍的——类加载过程。

1、类的生命周期

  类从被加载到虚拟机内存开始,到卸载出内存为止,其声明周期流程如下:

  

  上图中红色的5个部分(加载、验证、准备、初始化、卸载)顺序是确定的,也就是说,类的加载过程必须按照这种顺序按部就班的开始。这里的“开始”不是按部就班的“进行”或者“完成”,因为这些阶段通常是互相交叉混合的进行的,通常会在一个阶段执行过程中调用另一个阶段。

2、加载

  “加载”阶段是“类加载”生命周期的第一个阶段。在加载阶段,虚拟机要完成下面三件事:

  ①、通过一个类的全限定名来获取定义此类的二进制字节流。

  ②、将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。

  ③、在Java堆中生成一个代表这个类的java.lang.Class对象,作为方法区这些数据的访问入口。

  PS:类的全限定名可以理解为这个类存放的绝对路径。方法区是JDK1.7以前定义的运行时数据区,而在JDK1.8以后改为元数据区(Metaspace),主要用于存放被Java虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。详情可以参考这边该系列的第二篇文章——运行时内存结构

  另外,我们看第一点——通过类的权限定名来获取定义此类的二进制流,这里并没有明确指明要从哪里获取以及怎样获取,也就是说并没有明确规定一定要我们从一个 Class 文件中获取。基于此,在Java的发展过程中,充满创造力的开发人员在这个舞台上玩出了各种花样:

  1、从 ZIP 包中读取。这称为后面的 JAR、EAR、WAR 格式的基础。

  2、从网络中获取。比较典型的应用就是 Applet。

  3、运行时计算生成。这就是动态代理技术。

  4、由其它文件生成。比如 JSP 应用。

  5、从数据库中读取。

  加载阶段完成后,虚拟机外部的二进制字节流就按照虚拟机所需的格式存储在方法区中,然后在Java堆中实例化一个 java.lang.Class 类的对象,这个对象将作为程序访问方法区中这些类型数据的外部接口。

  注意,加载阶段与连接阶段的部分内容(如一部分字节码文件的格式校验)是交叉进行的,加载阶段尚未完成,连接阶段可能已经开始了。

3、验证

  验证是连接阶段的第一步,作用是为了确保 Class 文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。

  我们说Java语言本身是相对安全,因为编译器的存在,纯粹的Java代码要访问数组边界外的数据、跳转到不存在的代码行之类的,是要被编译器拒绝的。但是前面我们也说过,Class 文件不一定非要从Java源码编译过来,可以使用任何途径,包括你很牛逼,直接用十六进制编辑器来编写 Class 文件。

  所以,如果虚拟机不检查输入的字节流,将会载入有害的字节流而导致系统崩溃。但是虚拟机规范对于检查哪些方面,何时检查,怎么检查都没有明确的规定,不同的虚拟机实现方式可能都会有所不同,但是大致都会完成下面四个方面的检查。

①、文件格式验证

  校验字节流是否符合Class文件格式的规范,并且能够被当前版本的虚拟机处理。

  一、是否以魔数 0xCAFEBABE 开头。

  二、主、次版本号是否是当前虚拟机处理范围之内。

  三、常量池的常量中是否有不被支持的常量类型(检查常量tag标志)

  四、指向常量的各种索引值中是否有指向不存在的常量或不符合类型的常量。

  五、CONSTANT_Utf8_info 型的常量中是否有不符合 UTF8 编码的数据。

  六、Class 文件中各个部分及文件本身是否有被删除的或附加的其他信息。

  以上是一部分校验内容,当然远不止这些。经过这些校验后,字节流才会进入内存的方法区中存储,接下来后面的三个阶段校验都是基于方法区的存储结构进行的。

②、元数据验证

  第二个阶段主要是对字节码描述的信息进行语义分析,以保证其描述的信息符合Java语言规范要求。

  一、这个类是否有父类(除了java.lang.Object 类之外,所有的类都应当有父类)。

  二、这个类的父类是否继承了不允许被继承的类(被final修饰的类)。

  三、如果这个类不是抽象类,是否实现了其父类或接口之中要求实现的所有普通方法。

  四、类中的字段、方法是否与父类产生了矛盾(例如覆盖了父类的final字段、或者出现不符合规则的重载)

③、字节码验证

  第三个阶段字节码验证是整个验证阶段中最复杂的,主要是进行数据流和控制流分析。该阶段将对类的方法进行分析,保证被校验的方法在运行时不会做出危害虚拟机安全的行为。

  一、保证任意时刻操作数栈中的数据类型与指令代码序列都能配合工作。例如不会出现在操作数栈中放置了一个 int 类型的数据,使用时却按照 long 类型来加载到本地变量表中。

  二、保证跳转指令不会跳转到方法体以外的字节码指令中。

  三、保证方法体中的类型转换是有效的。比如把一个子类对象赋值给父类数据类型,这是安全的。但是把父类对象赋值给子类数据类型,甚至赋值给完全不相干的类型,这就是不合法的。

④、符号引用验证

  符号引用验证主要是对类自身以外(常量池中的各种符号引用)的信息进行匹配性的校验,通常需要校验如下内容:

  一、符号引用中通过字符串描述的全限定名是否能够找到相应的类。

  二、在指定类中是否存在符合方法的字段描述符及简单名称所描述的方法和字段。

  三、符号引用中的类、字段和方法的访问性(private、protected、public、default)是否可以被当前类访问。

4、准备

  准备阶段是正式为类变量分配内存并设置类变量初始值的阶段,这些内存是在方法区中进行分配。

  注意:

  一、上面说的是类变量,也就是被 static 修饰的变量,不包括实例变量。实例变量会在对象实例化时随着对象一起分配在堆中。

  二、初始值,指的是一些数据类型的默认值。基本的数据类型初始值如下(引用类型的初始值为null):

  

  比如,定义 public static int value = 123 。那么在准备阶段过后,value 的值是 0 而不是 123,把 value 赋值为123 是在程序被编译后,存放在类的构造器方法之中,是在初始化阶段才会被执行。但是有一种特殊情况,通过final 修饰的属性,比如 定义 public final static int value = 123,那么在准备阶段过后,value 就被赋值为123了。

5、解析

  解析阶段是虚拟机将常量池中的符号引用替换为直接引用的过程。

  符号引用(Symbolic References):符号引用以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能无歧义的定位到目标即可。符号引用与虚拟机实现的内存布局无关,引用的目标不一定已经加载到内存中。

  直接引用(Direct References):直接引用可以是直接指向目标的指针、相对偏移量或是一个能间接定位到目标的句柄。直接引用是与虚拟机实现内存布局相关的,同一个符号引用在不同虚拟机实例上翻译出来的直接引用一般不会相同。如果有了直接引用,那么引用的目标必定已经在内存中存在。

  解析动作主要针对类或接口、字段、类方法、接口方法四类符号引用,分别对应于常量池的 CONSTANT_Class_info、CONSTANT_Fieldref_info、CONSTANT_Methodref_info、CONSTANTS_InterfaceMethodref_info四种类型常量。

6、初始化

  初始化阶段是类加载阶段的最后一步,前面过程中,除第一个加载阶段可以通过用户自定义类加载器参与之外,其余过程都是完全由虚拟机主导和控制。而到了初始化阶段,则开始真正执行类中定义的Java程序代码(或者说是字节码)。

  在前面介绍的准备阶段中,类变量已经被赋值过初始值了,而初始化阶段,则根据程序员的编码去初始化变量和资源。

  换句话来说,初始化阶段是执行类构造器<clinit>() 方法的过程

  ①、<clinit>() 方法 是由编译器自动收集类中的所有类变量的赋值动作和静态语句块(static{})中的语句合并产生的,编译器收集的顺序是由语句在源文件中出现的顺序所决定的,静态语句块中只能访问到定义在静态语句块之前的变量,定义在它之后的变量,在前面的静态语句块中可以赋值,但是不能访问。

  比如如下代码会报错:

  

  但是你把第 14 行代码放到 static 静态代码块的上面就不会报错了。或者不改变代码顺序,将第 11 行代码移除,也不会报错。

  ②、<clinit>() 方法与类的构造函数(或者说是实例构造器<init>()方法)不同,它不需要显示的调用父类构造器,虚拟机会保证在子类的<init>()方法执行之前,父类的<init>()方法已经执行完毕。因此虚拟机中第一个被执行的<init>()方法的类肯定是 java.lang.Object。

  ③、由于父类的<clinit>() 方法先执行,所以父类中定义的静态语句块要优先于子类的变量赋值操作。

  ④、<clinit>() 方法对于接口来说并不是必须的,如果一个类中没有静态语句块,也没有对变量的赋值操作,那么编译器可以不为这个类生成<clinit>() 方法。

  ⑤、接口中不能使用静态语句块,但仍然有变量初始化的赋值操作,因此接口与类一样都会生成<clinit>() 方法。但接口与类不同的是,执行接口中的<clinit>() 方法不需要先执行父接口的<clinit>() 方法。只有当父接口中定义的变量被使用时,父接口才会被初始化。

  ⑥、接口的实现类在初始化时也一样不会执行接口的<clinit>() 方法。

  ⑦、虚拟机会保证一个类的<clinit>() 方法在多线程环境中被正确的加锁和同步。如果多个线程同时去初始化一个类,那么只会有一个线程去执行这个类的<clinit>() 方法,其他的线程都需要阻塞等待,直到活动线程执行<clinit>() 方法完毕。如果在一个类的<clinit>() 方法中有很耗时的操作,那么可能造成多个进程的阻塞。

  比如对于如下代码:

package com.yb.carton.controller;

/**
* Create by YSOcean
*/
public class ClassLoadInitTest { static class Hello{
static {
if(true){
System.out.println(Thread.currentThread().getName() + "init");
while(true){}
}
}
} public static void main(String[] args) {
new Thread(()->{
System.out.println(Thread.currentThread().getName()+"start");
Hello h1 = new Hello();
System.out.println(Thread.currentThread().getName()+"run over");
}).start(); new Thread(()->{
System.out.println(Thread.currentThread().getName()+"start");
Hello h2 = new Hello();
System.out.println(Thread.currentThread().getName()+"run over");
}).start();
} }

  运行结果如下:

  

  线程1抢到了执行<clinit>() 方法,但是该方法是一个死循环,线程2将一直阻塞等待。

  知道了类的初始化过程,那么类的初始化何时被触发呢?JVM大概规定了如下几种情况:

  ①、当虚拟机启动时,初始化用户指定的类。

  ②、当遇到用以新建目标类实例的 new 指令时,初始化 new 指定的目标类。

  ③、当遇到调用静态方法的指令时,初始化该静态方法所在的类。

  ④、当遇到访问静态字段的指令时,初始化该静态字段所在的类。

  ⑤、子类的初始化会触发父类的初始化。

  ⑥、如果一个接口定义了 default 方法,那么直接实现或间接实现该接口的类的初始化,会触发该接口的初始化。

  ⑦、使用反射 API 对某个类进行反射调用时,会初始化这个类。

  ⑧、当初次调用 MethodHandle 实例时,初始化该 MethodHandle 指向的方法所在的类。

Java虚拟机详解(十)------类加载过程的更多相关文章

  1. Java虚拟机详解----JVM常见问题总结

    [声明] 欢迎转载,但请保留文章原始出处→_→ 生命壹号:http://www.cnblogs.com/smyhvae/ 文章来源:http://www.cnblogs.com/smyhvae/p/4 ...

  2. 【深入Java虚拟机】一 JVM类加载过程

    首先Throws(抛出)几个自己学习过程中一直疑惑的问题: 1.什么是类加载?什么时候进行类加载? 2.什么是类初始化?什么时候进行类初始化? 3.什么时候会为变量分配内存? 4.什么时候会为变量赋默 ...

  3. 深入理解java虚拟机(八)类加载过程详解

    类从被加载到虚拟机内存开始,到卸载出内存为止,它的整个生命周期包括:加载(Loading).验证(Verification).准备(Preparation).解析(Resolution).初始化(In ...

  4. Java 虚拟机详解

    深入理解JVM 1   Java技术与Java虚拟机 说起Java,人们首先想到的是Java编程语言,然而事实上,Java是一种技术,它由四方面组成: Java编程语言.Java类文件格式.Java虚 ...

  5. Java虚拟机详解04----GC算法和种类【重要】

    [声明] 欢迎转载,但请保留文章原始出处→_→ 生命壹号:http://www.cnblogs.com/smyhvae/ 文章来源:http://www.cnblogs.com/smyhvae/p/4 ...

  6. Java虚拟机详解02----JVM内存结构

    主要内容如下: JVM启动流程 JVM基本结构 内存模型 编译和解释运行的概念 一.JVM启动流程: JVM启动时,是由java命令/javaw命令来启动的. 二.JVM基本结构: JVM基本结构图: ...

  7. java虚拟机详解

    注: 此篇文章可以算是读<深入理解Java虚拟机:JVM高级特性与最佳实践>一书后的笔记总结加上我个人的心得看法. 整体总结顺序沿用了书中顺序,但多处章节用自己的话或直白或扩展的进行了重新 ...

  8. Java虚拟机详解----JVM内存结构

    http://www.cnblogs.com/smyhvae/p/4748392.htm 主要内容如下: JVM启动流程 JVM基本结构 内存模型 编译和解释运行的概念 一.JVM启动流程: JVM启 ...

  9. Java虚拟机详解(三)------垃圾回收

    如果对C++这门语言熟悉的人,再来看Java,就会发现这两者对垃圾(内存)回收的策略有很大的不同. C++:垃圾回收很重要,我们必须要自己来回收!!! Java:垃圾回收很重要,我们必须交给系统来帮我 ...

随机推荐

  1. 基于 HTML5 + WebGL 实现的垃圾分类系统

    前言 垃圾分类,一般是指按一定规定或标准将垃圾分类储存.分类投放和分类搬运,从而转变成公共资源的一系列活动的总称.分类的目的是提高垃圾的资源价值和经济价值,力争物尽其用.垃圾在分类储存阶段属于公众的私 ...

  2. Js极客之路 - 优化操作(性能优化)

    1.因为每次For循环都会计算一次arr.length,所以有必要存储数组长度以减少计算.针对这篇文章(http://www.crimx.com/2015/04/21/should-array-len ...

  3. java集合第一节,List简单介绍

    Java中List集合的常用方法   List接口是继承Collection接口,所以Collection集合中有的方法,List集合也继承过来. package 集合; import java.ut ...

  4. 使用 statcounter 统计 Hexo 博客访问量

    介绍 statcounter是一个提供网站访问统计服务的网站: StatCounter is a simple but powerful real-time web analytics service ...

  5. java编写基于netty的RPC框架

    一 简单概念 RPC:(Remote Procedure Call),远程调用过程,是通过网络调用远程计算机的进程中某个方法,从而获取到想要的数据,过程如同调用本地的方法一样. 阻塞IO:当阻塞I/O ...

  6. Java基础(三十二)JDBC(2)连接数据库

    一.连接数据库的过程 连接数据库的过程:加载数据库驱动程序,不过只需在第一次访问数据库时加载一次,然后在每次访问数据库时创建一个Connection实例,然后执行操作数据库的SQL语句,并返回执行结果 ...

  7. Prometheus 介绍详解

    Prometheus 介绍 Prometheus(普罗米修斯)是一个最初在SoundCloud上构建的监控系统.自2012年成为社区开源项目,拥有非常活跃的开发人员和用户社区.为强调开源及独立维护,P ...

  8. Linux 命令之 crontab

    crontab 简介 crontab 主要用于需要管理周期执行定时任务的场景 crontab 安装 (有些系统默认已经带了 crontab,无需安装的朋友可以直接跳过本节) 安装: yum insta ...

  9. 爬虫学习--常用的正则表达式 Day3

    在做爬虫经常遇到需要用正则校验数据时候,往往是在网上去找很久,结果找来的还是不很符合要求.所以我最近把开发中常用的一些正则表达式整理了一下,给自己留个底,也给朋友们做个参考. 一.校验数字的表达式 1 ...

  10. 分类算法之逻辑回归(Logistic Regression

    分类算法之逻辑回归(Logistic Regression) 1.二分类问题 现在有一家医院,想要对病人的病情进行分析,其中有一项就是关于良性\恶性肿瘤的判断,现在有一批数据集是关于肿瘤大小的,任务就 ...