@

前言

前面学习了虚拟机的内存结构、对象的分配和创建,但对象所对应的类是怎么加载到虚拟机中来的呢?加载过程中需要做些什么?什么是双亲委派机制以及为什么要打破双亲委派机制?

类的生命周期



类的生命周期包含了如上的7个阶段,其中验证准备解析统称为连接 ,类的加载主要是前五个阶段,每个阶段基本上保持如上顺序开始(仅仅是开始,实际上执行是交叉混合的),只有解析阶段不一定,在初始化后也有可能才开始执行解析,这是为了支持动态语言。

加载

加载就是将字节码的二进制流转化为方法区的运行时数据结构,并生成类所对象的Class对象,字节码二进制流可以是我们编译后的class文件,也可以从网络中获取,或者运行时动态生成(动态代理)等等。

那什么时候会触发类加载呢?这个在虚拟机规范中没有明确定义,只是规定了何时需要执行初始化(稍后详细分析)。

验证

这个阶段很好理解,就是进行必要的校验,确保加载到内存中的字节码是符合要求的,主要包含以下四个校验步骤(了解即可):

  • 文件格式校验:这个阶段要校验的东西非常多,主要的有下面这些(实际上远远不止)

    • 是否以魔数0xCAFEBABE开头。
    • 主、次版本号是否在当前Java虚拟机接受范围之内。
    • 常量池的常量中是否有不被支持的常量类型(检查常量tag标志)。
    • 指向常量的各种索引值中是否有指向不存在的常量或不符合类型的常量。
    • CONSTANT_Utf8_info型的常量中是否有不符合UTF-8编码的数据。
    • Class文件中各个部分及文件本身是否有被删除的或附加的其他信息。
    • 。。。。。。
  • 元数据校验:对字节码描述信息进行语义分析。
    • 这个类是否有父类(除了java.lang.Object之外,所有的类都应当有父类)。
    • 这个类的父类是否继承了不允许被继承的类(被final修饰的类)。
    • 如果这个类不是抽象类,是否实现了其父类或接口之中要求实现的所有方法。
    • 类中的字段、方法是否与父类产生矛盾(例如覆盖了父类的final字段,或者出现不符合规则的方法重载,例如方法参数都一致,但返回值类型却不同等)。
    • 。。。。。。
  • 字节码校验:确保程序没有语法和逻辑错误,这是整个验证阶段最复杂的一个步骤。
    • 保证任意时刻操作数栈的数据类型与指令代码序列都能配合工作,例如不会出现类似于“在操作栈放置了一个 int 类型的数据,使用时却按 long 类型来加载入本地变量表中”这样的情况。
    • 保证任何跳转指令都不会跳转到方法体以外的字节码指令上。
    • 保证方法体中的类型转换总是有效的,例如可以把-个子类对象赋值给父类数据类型,这是安全的,但是把父类对象赋值给子类数据类型,甚至把对象赋值给与它毫无继承关系、完全不相干的一个数据类型,则是危险和不合法的。
    • 。。。。。。
  • 符号引用验证:这个阶段发生在符号引用转为直接引用的时候,即实际上是在解析阶段中进行的。
    • 符号引用中通过字符串描述的全限定名是否能找到对应的类。
    • 在指定类中是否存在符合方法的字段描述符及简单名称所描述的方法和字段。
    • 符号引用中的类、字段、方法的可访问性( private、 protected. public、 )。
    • 是否可被当前类访问。
    • 。。。。。。

准备

该阶段是为类变量(static)分配内存并设置零值,即类只要经过准备阶段其中的静态变量就是可使用的了,但此时类变量的值还不是我们想要的值,需要经过初始化阶段才会将我们希望的值赋值给对应的静态变量。

解析

解析就是将常量池中的符号引用替换为直接引用的过程。符号引用就是一个代号,比如我们的名字,而这里可以理解为就是类的完全限定名直接引用则是对应的具体的人、物,这里就是指目标的内存地址。为什么需要符号引用呢?因为类在加载到内存之前还没有分配内存地址,因此必然需要一个东西指代它。这个阶段包含了类或接口的解析字段解析类方法解析接口方法解析,在解析的过程中可能会抛出以下异常:

  • java.lang.NoSuchFieldError:找不到字段
  • java.lang.IllegalAccessError:不具有访问权限
  • java.lang.NoSuchMethodError:找不到方法

初始化

这是类加载过程中的最后一个步骤,主要是收集类的静态变量的赋值动作static块中的语句合成<cinit>方法,通过该方法根据我们的意愿为静态变量赋值以及执行static块,该方法会被加锁,确保多线程情况下只有一个线程能初始化成功,利用该特性可以实现单例模式。虚拟机规定了有且只有遇到以下情况时必须先确保对应类的初始化完成(加载、准备必然在此之前):

  • 遇到new、getstatic、putstatic或invokestatic这四条字节码指令时。能够生成这四条指令的典型Java代码场景有:

    • 使用new关键字实例化对象的时候。
    • 读取或设置一个类型的静态字段(被final修饰、已在编译期把结果放入常量池的静态字段除外)的时候。
    • 调用一个类型的静态方法的时候。
  • 反射调用类时。
  • 当初始化类的时候,如果发现其父类还没有进行过初始化,则需要先触发其父类的初始化。
  • 当虚拟机启动时,用户需要指定一个要执行的主类(包含main()方法的那个类),虚拟机会先初始化这个主类。
  • 当使用JDK 7新加入的动态语言支持时,如果一个java.lang.invoke.MethodHandle实例最后的解析结果为REF_getStatic、REF_putStatic、REF_invokeStatic、REF_newInvokeSpecial四种类型的方法句柄,并且这个方法句柄对应的类没有进行过初始化,则需要先触发其初始化。
  • 当一个接口中定义了JDK 8新加入的默认方法(被default关键字修饰的接口方法)时,如果有这个接口的实现类发生了初始化,那该接口要在其之前被初始化。

下面分析几个案例代码,读者们可以先思考后再运行代码看看和自己想的是否一样。

案例一

先定义如下两个类:

public class SuperClazz {
static {
System.out.println("SuperClass init!");
}
public static int value=123;
public static final String HELLOWORLD="hello world";
public static final int WHAT = value;
} public class SubClaszz extends SuperClazz {
static{
System.out.println("SubClass init!");
} }

然后进行下面的调用:

public class Initialization {
public static void main(String[]args){
Initialization initialization = new Initialization();
initialization.M1();
} public void M1(){
System.out.println(SubClaszz.value);
}
}

第一个案例是通过子类去引用父类中的静态变量,两个类都会加载和初始化么?打印结果看看:

SuperClass init!
123

可以看到只有父类初始化了,那么父类必然是加载了的,问题就在于子类有没有被加载呢?可以加上参数:-XX:+TraceClassLoading再执行(该参数的作用就是打印被加载了的类),可以看到子类是被加载了的。所以通过子类引用父类静态变量,父子类都会被加载,但只有父类会进行初始化

为什么呢?反编译后可以看到生成了如下指令:

0: getstatic     #5                  // Field java/lang/System.out:Ljava/io/PrintStream;
3: getstatic #6 // Field ex7/init/SubClaszz.value:I
6: invokevirtual #7 // Method java/io/PrintStream.println:(I)V
9: return

关键就是getstatic指令就会触发类的初始化,但是为什么子类不会初始化呢?因为这个变量是来自于父类的,为了提高效率,所以虚拟机进行了优化,这种情况只需要初始化父类就行了。

案例二

调用下面的方法:

	public void M2(){
SubClaszz[]sca = new SubClaszz[10];
}

执行后可以发现,使用数组,不会触发初始化,但父子类都会被加载

案例三

	public void M3(){
System.out.println(SuperClazz.HELLOWORLD);
}

引用常量不会触发类的加载和初始化,因为常量在编译后就已经存在当前class的常量池。

案例四

	public void M4(){
System.out.println(SubClaszz.WHAT);
}

通过常量去引用其它的静态变量会发生什么呢?这个和案例一结果是一样的。

类加载器

类加载器和双亲委派模型

在我们平时开发中,确定一个类需要通过完全限定名,而不能简单的通过名字,因为在不同的路径下我们是可以定义同名的类的。那么在虚拟机中又是怎么区分类的呢?在虚拟机中需要类加载器+完全限定名一起来指定一个类的唯一性,即相同限定名的类若由两个不同的类加载器加载,那虚拟机就不会把它们当做一个类。从这里我们可以看出类加载器一定是有多个的,那么不同的类加载器是怎么组织的?它们又分别需要加载哪些类呢?



从虚拟角度看,只有两种类型的类加载器:启动类加载器(BootstrapClassLoader)非启动类加载器。前者是C++实现,属于虚拟机的一部分,后者则是由Java实现的,独立于虚拟机的外部,并且全部继承自抽象类java.lang.ClassLoader。

但从Java本身来看,一直保持着三层类加载器双亲委派的结构,当然除了Java本身提供的三层类加载器,我们还可以自定义实现类加载器。如上图,上面三个就是原生的类加载器,每一个都是下一个类加载器的父加载器,注意这里都是采用组合而非继承。当开始加载类时,首先交给父加载器加载,父加载器加载了子加载器就不用再加载了,而若是父加载器加载不了,就会交给子加载器加载,这就是双亲委派机制。这就好比工作中遇到了无法处理的事,你会去请示直接领导,直接领导处理不了,再找上层领导,然后上层领导觉得这是个小事,不用他亲自动手,就让你的直接领导去做,接着他又交给你去做等等。下面来看看每个类加载器的具体作用:

  • BootstrapClassLoader:启动类加载器,顾名思义,这个类加载器主要负责加载JDK lib包,以及-Xbootclasspath参数指定的目录,并且虚拟机对文件名进行了限定,也就是说即使我们自己写个jar放入到上述目录,也不会被加载。由于该类加载器是C++使用,所以我们的Java程序中无法直接引用,调用java.lang.ClassLoader.getClassLoader()方法时默认返回的是null。
  • ExtClassLoader:扩展类加载器,主要负责加载JDK lib/ext包,以及被系统变量java.ext.dirs指向的所有类库,这个类库可以存放我们自己写的通用jar。
  • AppClassLoader:应用程序类加载器,负责加载用户classpath上的所有类。它是java.lang.ClassLoader.getSystemClassLoader()的返回值,也是我们程序的默认类加载器(如果我们没有自定义类加载器的话)。

通过这三个类加载以及双亲委派机制,一个显而易见的好处就是,不同的类随它的类加载器天然具有了加载优先级,像Object、String等等这些核心类库自然就会在我们的应用程序类之前被加载,使得程序更安全,不会出现错误,Spring的父子容器也是这样的一个设计。通过下面这段代码可以看到每个类所对应的类加载器:

public class ClassLoader {
public static void main(String[] args) {
System.out.println(String.class.getClassLoader()); //启动类加载器
System.out.println(sun.net.spi.nameservice.dns.DNSNameService.class.getClassLoader());//拓展类加载器
System.out.println(ClassLoader.class.getClassLoader());//应用程序类加载器
}
}

输出:

null
sun.misc.Launcher$ExtClassLoader@4b67cf4d
sun.misc.Launcher$AppClassLoader@14dad5dc

破坏双亲委派模型

刚刚我举了工作中的一个例子来说明双亲委派机制,但现实中我们不需要事事都去请示领导,同样类加载器也不是完全遵循双亲委派机制,在必要的时候是可以打破这个规则的。下面列举四个破坏的情况,在此之前我们需要先了解下双亲 委派的代码实现原理,在java.lang.ClassLoader类中有一个loadClass以及findClass方法:

    protected Class<?> loadClass(String name, boolean resolve)
throws ClassNotFoundException
{
synchronized (getClassLoadingLock(name)) {
// First, check if the class has already been loaded
Class<?> c = findLoadedClass(name);
if (c == null) {
long t0 = System.nanoTime();
try {
if (parent != null) {
c = parent.loadClass(name, false);
} else {
c = findBootstrapClassOrNull(name);
}
} catch (ClassNotFoundException e) {
// ClassNotFoundException thrown if class not found
// from the non-null parent class loader
} if (c == null) {
// If still not found, then invoke findClass in order
// to find the class.
long t1 = System.nanoTime();
c = findClass(name); // this is the defining class loader; record the stats
sun.misc.PerfCounter.getParentDelegationTime().addTime(t1 - t0);
sun.misc.PerfCounter.getFindClassTime().addElapsedTimeFrom(t1);
sun.misc.PerfCounter.getFindClasses().increment();
}
}
if (resolve) {
resolveClass(c);
}
return c;
}
} protected Class<?> findClass(String name) throws ClassNotFoundException {
throw new ClassNotFoundException(name);
}

从上面可以看到首先是调用parent去加载类,没有加载到才调用自身的findClass方法去加载。也就是说用户在实现自定义类加载器的时候需要覆盖的是fiindClass而不是loadClass,这样才能满足双亲委派模型

下面具体来看看破坏双亲委派的几个场景。

第一次

第一次破坏是在双亲委派模型出现之前, 因为该模型是在JDK1.2之后才引入的,那么在此之前,抽象类java.lang.ClassLoader就已经存在了,用户自定义的类加载器都会去覆盖该类中的loadClass方法,所以双亲委派模型出现后,就无法避免用户覆盖该方法,因此新增了findClass引导用户去覆盖该方法实现自己的类加载逻辑。

SPI

第二次破坏是由于这个模型本身缺陷导致的,因为该模型保证了类的加载优先级,但是有些接口是Java定义在核心类库中,但具体的服务实现是由用户提供的,这时候就不得不破坏该模型才能实现,典型的就是Java中的SPI机制(对SPI不了解的读者可以翻阅我之前的文章或是其它资料,这里不进行阐述)。J

DBC的驱动加载就是SPI实现的,所以直接看到java.sql.DriverManager类,该类中有一个静态初始化块:

    static {
loadInitialDrivers();
println("JDBC DriverManager initialized");
} private static void loadInitialDrivers() {
String drivers;
try {
drivers = AccessController.doPrivileged(new PrivilegedAction<String>() {
public String run() {
return System.getProperty("jdbc.drivers");
}
});
} catch (Exception ex) {
drivers = null;
} AccessController.doPrivileged(new PrivilegedAction<Void>() {
public Void run() { ServiceLoader<Driver> loadedDrivers = ServiceLoader.load(Driver.class);
Iterator<Driver> driversIterator = loadedDrivers.iterator(); try{
while(driversIterator.hasNext()) {
driversIterator.next();
}
} catch(Throwable t) {
// Do nothing
}
return null;
}
}); println("DriverManager.initialize: jdbc.drivers = " + drivers); if (drivers == null || drivers.equals("")) {
return;
}
String[] driversList = drivers.split(":");
println("number of Drivers:" + driversList.length);
for (String aDriver : driversList) {
try {
println("DriverManager.Initialize: loading " + aDriver);
Class.forName(aDriver, true,
ClassLoader.getSystemClassLoader());
} catch (Exception ex) {
println("DriverManager.Initialize: load failed: " + ex);
}
}
}

主要看ServiceLoader.load方法,这个就是通过SPI去加载我们引入java.sql.Driver实现类(比如引入mysql的驱动包就是com.mysql.cj.jdbc.Driver):

    public static <S> ServiceLoader<S> load(Class<S> service) {
ClassLoader cl = Thread.currentThread().getContextClassLoader();
return ServiceLoader.load(service, cl);
}

这个方法主要是从当前线程中获取类加载器,然后通过这个类加载器去加载驱动实现类(这个叫线程上下文类加载器,我们也可以使用这个技巧去打破双亲委派),那这里会获取到哪一个类加载器呢?具体的设置是在sun.misc.Launcher类的构造器中:

    public Launcher() {
Launcher.ExtClassLoader var1;
try {
var1 = Launcher.ExtClassLoader.getExtClassLoader();
} catch (IOException var10) {
throw new InternalError("Could not create extension class loader", var10);
} try {
this.loader = Launcher.AppClassLoader.getAppClassLoader(var1);
} catch (IOException var9) {
throw new InternalError("Could not create application class loader", var9);
} Thread.currentThread().setContextClassLoader(this.loader);
String var2 = System.getProperty("java.security.manager");
if (var2 != null) {
SecurityManager var3 = null;
if (!"".equals(var2) && !"default".equals(var2)) {
try {
var3 = (SecurityManager)this.loader.loadClass(var2).newInstance();
} catch (IllegalAccessException var5) {
} catch (InstantiationException var6) {
} catch (ClassNotFoundException var7) {
} catch (ClassCastException var8) {
}
} else {
var3 = new SecurityManager();
} if (var3 == null) {
throw new InternalError("Could not create SecurityManager: " + var2);
} System.setSecurityManager(var3);
} }

可以看到设置的就是AppClassLoader。你可能会有点疑惑,这个类加载器加载类的时候不也是先调用父类加载器加载么,怎么就打破双亲委派了呢?其实打破双亲委派指的就是类的层次结构,延伸意思就是类的加载优先级,这里本应该是在加载核心类库的时候却提前将我们应用程序中的类库给加载到虚拟机中来了。

Tomcat



上图是Tomcat类加载的类图,前面三个不用说,CommonClassLoaderCatalinaClassLoaderSharedClassLoaderWebAppClassLoaderJspClassLoader则是Tomcat自己实现的类加载器,分别加载common包server包shared包WebApp/WEB-INF/lib包以及JSP文件,前面三个在tomcat 6之后已经合并到根目录下的lib目录下。而WebAppClassLoader则是每一个应用程序对应一个,JspClassLoader是每一个JSP文件都会对应一个,并且这两个类加载器都没有父类加载器,这也就违背了双亲委派模型。

为什么每个应用程序需要单独的WebAppClassLoader实例?因为每个应用程序需要彼此隔离,假如在两个应用中定义了一样的类(完全限定名),如果遵循双亲委派那就只会存在一份了,另外不同的应用还有可能依赖同一个类库的不同版本,这也需要隔离,所以每一个应用程序都会对应一个WebAppClassLoader,它们共享的类库可以让SharedClassLoader加载,另外这些类加载加载的类对Tomcat本身来说也是隔离的(CatalinaClassLoader加载的)。

为什么每个JSP文件需要对应单独的一个JspClassLoader实例?这是由于JSP是支持运行时修改的,修改后会丢弃掉之前编译生成的class,并重新生成一个JspClassLoader实例去加载新的class。

以上就是Tomcat为什么要打破双亲委派模型的原因。

OSGI

OSGI是用于实现模块热部署,像Eclipse的插件系统就是利用OSGI实现的,这个技术非常复杂同时使用的也越来越少了,感兴趣的读者可自行查阅资料学习,这里不再进行阐述。

总结

类加载的过程让我们了解到一个类是如何被加载到内存中,需要经过哪些阶段;而类加载器和双亲委派模型则是告诉我们应该怎么去加载类、类的加载优先级是怎样的,其中的设计思想我们也可以学习借鉴;最后需要深刻理解的是为什么需要打破双亲委派,在遇到相应的场景时应该怎么做。

深入探究JVM之类加载与双亲委派机制的更多相关文章

  1. JVM学习六:JVM之类加载器之双亲委派机制

    前面我们知道类加载有系统自带的3种加载器,也有自定义的加载器,那么这些加载器之间的关系是什么,已经在加载类的时候,谁去加载呢?这节,我们将进行讲解. 一.双亲委派机制 JVM的ClassLoader采 ...

  2. JVM探究(一)谈谈双亲委派机制和沙箱安全机制

    JVM探究 请你谈谈你对JVM的理解?java8虚拟机和之前的变化gengxin? 什么是OOM,什么是栈溢出StackOverFlowError JVM的常用调优参数有哪些? 内存快转如何抓取,怎么 ...

  3. JVM类加载与双亲委派机制被打破

    前言 前文已经讲了虚拟机将java文件编译成class文件后的格式:JVM虚拟机Class类文件研究分析 java文件经过编译,形成class文件,那么虚拟机如何将这些Class文件读取到内存中呢? ...

  4. 面试~jvm(JVM内存结构、类加载、双亲委派机制、对象分配,了解垃圾回收)

    一.JVM内存结构 ▷ 谈及内存结构各个部分的数据交互过程:还可以再谈及生命周期.数据共享:是否GC.是否OOM 答:jvm 内存结构包括程序计数器.虚拟机栈.本地方法栈.堆.方法区:它是字节码运行时 ...

  5. JVM(三、双亲委派机制)

    javadoc的解释: ClassLoader的每一个实例都会有一个与之关联的父ClassLoader,当被要求去寻找一个类或者资源的时候,ClassLoader的实例就会对于类或者是资源的寻找委托给 ...

  6. 【Java_基础】java类加载过程与双亲委派机制

    1.类的加载.连接和初始化 当程序使用某个类时,如果该类还未被加载到内存中,则系统会通过加载.连接.初始化三个步骤来对类进行初始化.如果没有意外,jvm将会连续完成这三个步骤,有时也把这三个步骤统称为 ...

  7. Java类加载器和双亲委派机制

    前言 之前详细介绍了Java类的整个加载过程(类加载机制详解).虽然,篇幅较长,但是也不要被内容吓到了,其实每个阶段都可以用一句话来概括. 1)加载:查找并加载类的二进制字节流数据. 2)验证:保证被 ...

  8. 深入JVM系列(三)之类加载、类加载器、双亲委派机制与常见问题

    一.概述   定义:虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验.转换解析和初始化,最终形成可以被虚拟机直接使用的java类型.类加载和连接的过程都是在运行期间完成的. 二. 类的 ...

  9. JVM之类加载器、加载过程及双亲委派机制

    JVM 的生命周期 虚拟机的启动 Java 虚拟机的启动是通过引导类加载器(bootstrap class loader)创建一个初始类(initial class)来完成的,这个类是由虚拟机的具体实 ...

随机推荐

  1. P4408 逃学的小孩 题解

    题目描述 Chris家的电话铃响起了,里面传出了Chris的老师焦急的声音:"喂,是Chris的家长吗?你们的孩子又没来上课,不想参加考试了吗?"一听说要考试,Chris的父母就心 ...

  2. 如何查询到你的wifi所在的公网ip?

    浏览器中输入:ip138.com  即可查询到.

  3. Linux多任务编程之六:编写多进程程序及其代码(转)

    来源:CSDN  作者:王文松  转自Linux公社 ------------------------------------------------------------------------- ...

  4. PE文件动态加载执行过程

    主要步骤: 1.将要加载的文件读取到内存中(简称为文内),检查文件格式无误后,根据可选PE头(简称op头)的SizeOfImage,申请出一块空间用于存储该文件加载到内存后展开的数据(简称为内内).记 ...

  5. CSS(二)- 选择器 - 伪元素和伪类(思维导图)

    伪元素 伪元素可以创建一些文档语言无法创建的虚拟元素.比如:文档语言没有一种机制可以描述元素内容的第一个字母或第一行,但伪元素可以做到(::first-letter.::first-line).同时, ...

  6. JVM 专题二:虚拟机(二)Java虚拟机

    2.1 什么是Java虚拟机? Java虚拟机是一台执行字节码的虚拟计算机,它拥有独立的运行机制,其运行的Java字节码也未必由Java语言编译而成. JVM平台的各种语言可以共享Java虚拟机带来的 ...

  7. 在spyder中无法import module

    如果在anaconda中下载安装了模块,但是在spyder中无法import,可能是因为两个python环境并不一致,在promote重新conda install spyder即可

  8. keyring源码加密解密函数分析

    Encrypt the page data contents. Page type can't be FIL_PAGE_ENCRYPTED, FIL_PAGE_COMPRESSED_AND_ENCRY ...

  9. day1:注释和变量

    1.注释的作用:对代码的解释,方便以后阅读代码 2.常用的快捷键:ctrl+q:notepad++的注释ctrl+/:pycharm的注释ctrl+c:复制ctrl+v:粘贴ctrl+z:撤销ctrl ...

  10. Mock分页

    前后端分离开发时,一般会使用mock. 因为mock是用node运行的,行为与调用后台一致. 这样,不需要等后台写好,只要有接口文档,前端可以自己调接口,这样联调时遇到的问题会少很多,可以加快整体开发 ...