深入分析JVM执行引擎
程序和机器沟通的桥梁
一、闲聊
相信很多朋友在出国旅游,或者与外国友人沟通的过程中,都会遇到语言不通的烦恼。这时候我们就需要掌握对应的外语或者拥有一部翻译机。而笔者只会中文,所以需要借助一部翻译器才能与不懂中文的外国友人交流。咱们的执行引擎就类似于这部“翻译机”。
二、概述
执行引擎的作用就是将字节码指令解释或者编译为对应平台上的本地机器指令。简单来说,执行引擎充当了将高级语言翻译为机器语言的翻译者。对于Hotspot虚拟机,执行引擎中包含两部分:解释器和JIT编译器(即时编译器)。下图是执行引擎的原理:
三、解释器
解释器所承担的角色就是一个运行时翻译者
,将字节码文件中的内容翻译
为对应平台的本地机器码指令。当一条字节码指令被解释执行后,接着再根据pc寄存器中记录的下一条需要被执行的字节码指令执行解释操作。JVM解释器一共有两套,一套是远古的字节码解释器
,另一套是现在普遍使用的模板解释器
。
1、字节码解释器
字节码解释器在执行过程中通过纯软件代码
模拟字节码执行,效率非常低。
2、模板解释器
模板解释器将每一条字节码和一个模板函数关联
,模板函数中直接产生这条字节码指令执行时的机器码,从而提高了解释器的性能。在常用的HotSpot VM中,解释器主要由Interpreter模板和code模块构成。Interpreter模板:实现了解释器的核心功能。code模块:用于管理HotSpot VM在运行时生成的本地机器码指令。
四、即时编译器(JIT编译器)
即时编译器的目的是避免函数被解释执行,而是将整个函数体编译成机器码指令,每次函数执行时,只执行编译后的机器码即可,这种方式可以大大的提高效率。
1、热点代码及探测方式
当然,是否需要JIT编译器将字节码直接编译成对应平台的机器码,需要根据代码被调用的执行频率
而定。需要被JIT编译器编译成机器码的字节码,也称为热点代码
,JIT编译器会对热点代码做出深度优化
,将其从字节码编译成机器码,并缓存到方法区
,提高代码的执行效率。
JIT编译的方式发生在方法执行过程中,因此也被称之为_栈上替换_,或简称OSR(On Stack Replacement)编译。通过热点探测
的方法,判断一个方法被调用多少次,或循环体执行多少次才可以达到阈值,进行编译。而Hotspot VM热点探测的方式是基于计数器实现的。这种基于技术的热点探测方式又分为两种:1.方法调用计数器 2.回边计数器
关于栈上替换这里笔者不展开赘述,有兴趣的小伙伴可以自行了解下
1.1方法调用计数器
方法调用计数器用于统计方法调用次数,它的默认阈值是client模式下是1500次,在server模式下是10000次。超过这个阈值,就会触发JIT编译。当然,这个阈值也可以通过修改虚拟机参数-XX:CompileThreshold
来手动指定。
当一个方法被调用的时候,会优先检查该方法是否被JIT编译过,如果存在,则优先使用编译过的本地代码来执行,如果不存在,则将此方法的调用计数器加一,然后再判断计数器的值是否超过配置的阈值。如果已经超过了,就会向JIT编译器提交一个该方法的编译请求。下面是方法调用计数器执行的流程图:
关于方法调用计数器,如果不做任何设置,方法调用计数器统计的并不是方法被调用的绝对次数,而是一个相对执行的频率。当超过一定的时间限度,如果方法的调用次数仍然达不到阈值,那这个方法的调用计数器就会被减少一半,这个过程称为方法调用计数器的热度衰减
,而这段时间被称作为该方法的半衰周期
。
进行热度衰减的过程是虚拟机进行垃圾回收的时候顺便进行的,举手之劳而已。可以使用虚拟机参数-XX:-UseCounterDecay
来关闭热度衰减。这样的话,只要运行时间足够长,绝大部分方法都会被编译成本地代码。最后,还可以使用-XX:CounterHalfLifeTime
参数设置半衰周期的时间,单位为秒。
1.2回边计数器
它的作用是统计一个方法中循环体代码执行次数
,在字节码中遇到控制流向后,跳转的指令称为“回边”。显然,建立回边计数器统计的目的是为了触发OSR编译。下面是回边计数器执行的流程图:
关于OSR编译上文中有提到
2、即时编译器分类
在Hotspot VM中,内嵌有两个JIT编译器,分别为client compiler和server compiler,但是大多数情况下我们简称C1编译器和C2编译器。可以通过命令显示的指定JVM在运行时到底使用哪种JIT编译器。
2.1 c1编译器
指定Java虚拟机运行在client模式下,使用C1编译器。C1编译器会对字节码进行简单和可靠的优化,耗时短。以达到更快的编译速度,但是编译后的代码执行速度相对慢。C1编译器主要有方法内联,去虚拟化,冗余消除。
- 方法内联:将引用的函数代码编译到引用点处,这样可以减少栈帧的生成,减少参数传递以及跳转过程。
- 去虚拟化:对唯一实现的类进行内联。
- 冗余消除:在运行期间把一些不会执行的代码叠掉。
2.2 c2编译器
指定Java虚拟机运行在server模式下,使用C2编译器。C2编译器对代码优化时间长,编译时间也长。但是编译后的代码执行速度比较快。C2的优化主要在全局层面,逃逸分析式优化的基础。基于逃逸分析,C2上有如下几种优化:
- 标量替换:用标量值代替聚合对象的属性值。
- 栈上分配:对于未逃逸的对象分配在栈上而不是堆上。
- 同步消除:清楚同步操作,通常指synchronized。
2.3 Graal编译器
JDK10起,在C1编译器和C2编译器之后,HotSpot VM新增了一个Graal即时编译器。编译效果短短几年的时间就追平了C2编译器。目前,带着“实验状态”标签,需要使用开关参数-XX:+UnlockExperimentalVMOptions
,-XX:+UseJVMCICompiler
去激活这个编译器,才能使用。
五、解释器和JIT并存
为什么需要解释器和JIT并存,原因有几点:
- 当程序启动的时候,解释器可以马上发挥作用,省去编译的时间。
- 编译器想要执行,需要把字节码编译成本地机器码,并且缓存编译后的机器码,编译需要一定的时间。
- 编译后的本地机器码,执行效率高。所以,在两种并存的模式下,解释器首先发挥作用,而不必等到即时编译器全部编译完在执行,这样可以省去不必要的编译时间。
- 随着程序继续不断运行,编译器发挥作用,根据
热点探测
功能,把越来越多的字节码编译成本地机器码,获得更高的执行效率。
六、执行引擎执行程序的方式
在默认的情况下,HotSpot VM采用的是解释器和JIT编译器并存的架构,当然读者可以根据具体的应用场景,通过虚拟机参数,为虚拟机指定在运行时到底是完全采用解释器执行,还是完全采用即时编译器执行。
-Xint
:完全采用解释器模式执行程序-XComp
:完全采用即时编译器模式执行程序。如果即时编译器出现问题,解释器会介入执行;-Xmixed
:采用解释器+即时编译器的混合模式共同执行程序,HotStop VM默认就是这个模式。
深入分析JVM执行引擎的更多相关文章
- 第 12 章 JVM执行引擎
目录 第 12 章 执行引擎 1.执行引擎概述 1.1.执行引擎概述 1.2.执行引擎工作过程 2.Java 代码编译和执行过程 2.1.解释执行和即时编译 2.2.解释器和编译器 3.机器码 指令 ...
- JVM执行引擎
1.概述 执行引擎是jvm核心组成部分之一,建立在物理器,硬件和操作系统层面之上,引擎在执行代码时会有解释执行和编译执行两种选择,输入字节码文件,字节码解析输出结果. 2.栈帧 栈帧是用于支持虚拟机进 ...
- 图解JVM执行引擎之方法调用
一.方法调用 方法调用不同于方法执行,方法调用阶段的唯一任务就是确定被调用方法的版本(即调用哪一个方法),暂时还不涉及方法内部的具体运行过程.Class文件的编译过程中不包括传统编译器中的连接步骤,一 ...
- JVM执行引擎总结(读《深入理解JVM》) 早期编译优化 DCE for java
execution engine: 运行时栈current stack frame主要保存了 local variable table, operand stack, dynamic linking, ...
- JVM执行引擎的执行过程
摘自深入分析java web技术内幕
- JVM 专题十五:执行引擎
1. 执行引擎概述 1.1 执行引擎 1.2 概述 执行引擎是Java虚拟机的核心组成部分之一. 虚拟机是一个相对于“物理机”的概念,这两种机器都有代码执行能力,其区别是物理机的执行引擎是直接建立在处 ...
- 【JVM之内存与垃圾回收篇】执行引擎
执行引擎 执行引擎概述 执行引擎属于 JVM 的下层,里面包括 解释器.及时编译器.垃圾回收器 执行引擎是 Java 虚拟机核心的组成部分之一. "虚拟机"是一个相对于" ...
- Java虚拟机执行引擎
执行引擎 关于执行引擎相关的部分, 在之前的博文里 Java内存区域中已经有所提及. 回顾一下: 也只有几个概念, JVM方法调用和执行的基础数据结构是 栈帧, 是内存区域中 虚拟机栈中的栈元素, 每 ...
- JVM执行原理
,Java是一种技术,它由四方面组成:Java编程语言.Java类文件格式.Java虚拟机和Java应用程序接口(Java API).它们的关系如下图所示: 运行期环境代表着Java平台,开发人员编写 ...
随机推荐
- mac上使用Vmware Fusion虚拟机配置Centos的静态ip
一.背景 本文简单记录一下,在mac arm 架构下使用 Vmware Fusion虚拟机下Centos7下如何配置静态ip地址.如果使用dhcp静态ip地址的动态分配,那么可能ip地址会发生变化,因 ...
- JS:对象调方法1
找调用者 1.如果有this,就先看this在哪个函数中,就是离this最近的function,没有就是window 2.找到函数后,辨别哪个是调用者 例1: 点击查看代码 function fn() ...
- 六张图详解LinkedList 源码解析
LinkedList 底层基于链表实现,增删不需要移动数据,所以效率很高.但是查询和修改数据的效率低,不能像数组那样根据下标快速的定位到数据,需要一个一个遍历数据. 基本结构 LinkedList 是 ...
- SAP 文本框多行输入
REPORT zjw_test01. CONSTANTS: gc_text_line_length TYPE i VALUE 72. TYPES: text_table_type(gc_text_li ...
- 论文解读(SR-GNN)《Shift-Robust GNNs: Overcoming the Limitations of Localized Graph Training Data》
论文信息 论文标题:Shift-Robust GNNs: Overcoming the Limitations of Localized Graph Training Data论文作者:Qi Zhu, ...
- Python简单实现自动评论、自动点赞、自动关注脚本
一些哔哔: 今天的这个脚本,是一个别人发的外包,交互界面的代码就不在这里说了,但是可以分享下自动评论.自动点赞.自动关注.采集评论和视频的数据是如何实现的 开发环境 python 3.8 运行代码py ...
- 8.4 苹果macOS电脑如何安装Java开发环境(JDK)
和Windows电脑安装差不多. 下载 来到JDK官方下载界面,点击Java SE 8(简称JDK 8)后面的JDK下载,来到该界面,先同意协议,然后下载对应平台的JDK,我们这里下载Mac OS X ...
- Three.js系列: 在元宇宙看电影,享受 VR 视觉盛宴
本文 gihtub 地址: https://github.com/hua1995116/Fly-Three.js 最近元宇宙的概念很火,并且受到疫情的影响,我们的出行总是受限,电影院也总是关门,但是在 ...
- 强化学习-学习笔记14 | 策略梯度中的 Baseline
本篇笔记记录学习在 策略学习 中使用 Baseline,这样可以降低方差,让收敛更快. 14. 策略学习中的 Baseline 14.1 Baseline 推导 在策略学习中,我们使用策略网络 \(\ ...
- Unique -「企划」新生守则(?
随想随记,主要是整活. 红色贝雷帽大爷会在校园不定期游走,遇见记得打招呼. 面食堂冰沙类饮品请快速解决或者边喝边搅,如果发现饮品甜度骤减请快速前往最近的垃圾桶扔掉. 关于散养猫小黄和小黑. 如果看见小 ...