正文

Java 语言的 3 类编译器:

  • 前端编译器:把 java 文件 转变成 class 文件。例如:Sun 的 Javac。
  • JIT 编译器(即时编译器):后端运行期编译器,把字节码转变成机器码。例如:HotSpot VM 的 C1、C2 编译器。
  • AOT 编译器(静态提前编译器):直接把 java 文件编译成本地机器代码。例如:GCJ(GNU Compiler for the Java)。

Java 语言的“编译期”是一段“不确定”的操作过程,它可能是 3 类编译器中某类的编译过程。

一、Javac 编译器

Javac 的编译过程大致可分为 3 个过程:

  • 解析与填充符号表过程。
  • 插入式注解处理器的注解处理过程。
  • 分析与字节码生成过程。

这 3 个步骤之间的关系与交互顺序如下图所示:

Javac 的编译动作入口是 com.sun.tools.javac.main.JavaCompiler 类,上述 3 个过程的代码逻辑集中在这个类的 compile() 和 compile2() 方法中。

1、解析与填充符号表

(1)词法、语法分析

词法分析是将源代码的字符流转变为标记(Token)集合,单个字符是程序编写过程的最小元素,而标记则是编译过程的最小元素,关键字、变量名、字面量、运算符都可以成为标记。

语法分析是根据 Token 序列构造抽象语法树的过程。

抽象语法树(AST)是一种用来描述程序代码语法结构的树形表示方式,语法树的每一个节点都代表着程序代码中的一个语法结构,例如包、类型、修饰符、运算符、接口、返回值甚至代码注释等都可以是一个语法结构。生成抽象语法树之后,编译器的后续操作基本都建立在抽象语法树之上。

在 Javac 源码中,词法分析过程由 com.sun.tools.javac.parser.Scanner 类实现,语法分析过程则由 com.sun.tools.javac.parser.Parser 类实现,生成的抽象语法树由 com.sun.tools.javac.tree.JCTree 类表示。

(2)填充符号表

符号表是由一组符号地址和符号信息构成的表格,可以把它想象成哈希表中 K-V 值对的形式。符号表中所登记的信息在编译的不同阶段都要用到。

在 Javac 源码中,填充符号表的过程由 com.sun.tools.javac.comp.Enter 类实现。

2、注解处理

JDK1.6 提供了一组插入式注解处理器的标准 API,在编译期间对注解进行处理。可以把这组 API 看做是一组编译器的插件,在这些插件里面,可以读取、修改、添加抽象语法树中的任何元素。

如果这些插件在处理注解期间对语法树进行了修改,编译器将回到解析及填充符号表的过程重新处理,直到所有插入式注解处理器都没有再对语法树进行修改为止。

在 Javac 源码中,插入式注解处理的初始化过程是在 initProcessAnnotations() 方法中完成的,它的执行过程则是在 processAnnotations() 方法中完成的。

3、语义分析与字节码生成

语法分析之后,编译器获得了程序代码的抽象语法树表示,语法树能表示一个结构正确的源程序的抽象,但无法保证源程序是符合逻辑的。

语义分析的主要任务就是对结构上正确的源程序进行上下文逻辑审查,包括标注检查、数据及控制流分析两个步骤。

(1)标注检查

标注检查的内容包括变量使用前是否已被声明、变量与赋值之间的数据类型是否能够匹配等。

常量折叠:

标注检查会将表达式的结果值在语法树上标注出来,这个动作称为常量折叠。

比如定义了一个 int a = 1 + 2;。在语法树上仍然能看到字面量“1”、“2”以及操作符“+”,但是经过常量折叠后,会被折叠为字面量“3”,并且会在语法树上标注出来。

在 Javac 源码中,标注检查的入口是 attribute() 方法,具体操作由 com.sun.tools.javac.comp.Attr 类和 com.sun.tools.javac.comp.Check类完成。

(2)数据及控制流分析

数据及控制流分析是对程序上下文逻辑更进一步的验证,包括局部变量在使用前是否有赋值、方法的每条路径是否都有返回值、是否所有的受查异常都被正确处理等。

编译期的数据及控制流分析与类加载时的数据及控制流分析的目的基本上是一致的,只是检验范围有所区别,有一些校验项只有在编译期或运行期才能进行。

在 Javac 源码中,数据及控制流分析的入口是 flow() 方法,具体操作由 com.sun.tools.javac.comp.Flow类完成。

(3)解语法糖

语法糖是指在计算机语言中添加的某种语法,这种语法对语言的功能没有影响,但是能够方便程序员使用,增加程序的可读性,从而减少程序代码出错的机会。

虚拟机运行时并不支持语法糖的语法,因此,需要在编译阶段还原回简单的基础语法结构,这个过程称为解语法糖。

在 Javac 源码中,解语法糖的过程由 desugar() 方法触发,在 com.sun.tools.javac.comp.TransTypes 类和 com.sun.tools.javac.comp.Lower 类中完成。

(4)字节码生成

字节码生成是 Javac 编译过程的最后一个阶段,在 Javac 源码中由 com.sun.tools.javac.jvm.Gen 类完成。

字节码生成阶段不仅仅是把前面各个步骤所生成的信息(语法树、符号表)转化成字节码写到磁盘中,编译器还进行了少量的代码添加和转换工作。例如,实例构造器 init() 方法和类构造器 clinit() 方法就是在这个阶段添加到语法树之中的。

完成了对语法树的遍历和调整之后,会把填充了所有所需信息的符号表交给 com.sun.tools.javac.jvm.ClassWriter 类,由这个类的 writeClass() 方法输出字节码,生成最终的 class 文件。

二、Java 语法糖的味道

1、泛型与类型擦除

泛型的本质是参数化类型的应用,即将所操作的数据类型指定为一个参数。这种参数类型可以用在类、接口和方法的创建中,分别称为泛型类、泛型接口和泛型方法。

C# 与 Java 的泛型:

泛型技术在 C# 和 Java 之中的使用方式看似相同,但实现上却有着根本性的分歧。

C# 的泛型无论在程序源码中、编译后的 IL (中间语言,这时候泛型是一个占位符)中,或是运行期的 CLR(公共语言运行库) 中,都是切实存在的。在 C# 中,List 与 List 就是两个不同的类型,它们在系统运行期生成,有自己的虚方法表和数据类型,这种实现称为类型膨胀,基于这种方法实现的泛型称为真实泛型

Java 的泛型只在程序源码中存在,在编译后的字节码文件中,就已经替换为原来的原生类型(也称为裸类型)了,并且在相应的地方插入了强制转型代码。因此,对于运行期的 Java 语言来说,ArrayList 与 ArrayList 就是同一个类,所以泛型技术实际上是 Java 语言的一颗语法糖,Java 语言中的泛型实现方法称为类型擦除,基于这种方法实现的泛型称为伪泛型

2、自动装箱与拆箱、遍历循环、变长参数

自动装箱与拆箱在编译之后被转化成了对应的包装和还原方法。比如 Integer.valueOf() 与 Integer.intValue()。

遍历循环把代码还原成了迭代器的实现,这也是为何遍历循环需要被遍历的类实现 Iterable 接口的原因。

变长参数在调用的时候变成了一个数组类型的参数。

3、条件编译

条件编译是指编译器在编译时只对满足条件的代码进行编译,而将不满足条件的代码舍弃。

Java 语言可以使用条件为布尔常量值的 if 语句进行条件编译。根据布尔常量值的真假,编译器会舍弃分支中不成立的代码块。

《深入理解 Java 虚拟机》读书笔记:早期(编译期)优化的更多相关文章

  1. 深入理解Java虚拟机 -- 读书笔记(1):JVM运行时数据区域

    深入理解Java虚拟机 -- 读书笔记:JVM运行时数据区域 本文转载:http://blog.csdn.net/jubincn/article/details/8607790 本系列为<深入理 ...

  2. 【Todo】深入理解Java虚拟机 读书笔记

    有一个在线系列地址 <深入理解Java虚拟机:JVM高级特性与最佳实践(第2版)> http://book.2cto.com/201306/25426.html 已经下载了这本书(60多M ...

  3. 深入理解Java虚拟机读书笔记6----早期(编译期)优化

    六 早期(编译期)优化   1 “编译期”的含义     · 可能是指一个前端编译器把*.java文件转变成*.class文件的过程,前端编译器如:Sun的Javac.Eclipse JDT中的增量式 ...

  4. 深入理解Java虚拟机读书笔记5----虚拟机字节码执行引擎

    五 虚拟机字节码执行引擎   1 运行时栈帧结构     ---栈帧是用于支持虚拟机进行方法调用和方法执行的数据结构,是虚拟机运行时数据区中的虚拟机栈的栈元素.     ---栈帧中存储了方法的局部变 ...

  5. 深入理解Java虚拟机读书笔记7----晚期(运行期)优化

    七 晚期(运行期)优化 1 即时编译器(JIT编译器)     ---当虚拟机发现某个方法或代码块的运行特别频繁时,就会把这些代码认定为“热点代码”,包括被多次调用的方法和被多次执行的循环体.     ...

  6. 深入理解Java虚拟机读书笔记4----虚拟机类加载机制

    四 虚拟机类加载机制 1 类加载机制     ---概念:虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验.转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型.     -- ...

  7. 深入理解Java虚拟机读书笔记3----类文件结构

    三 类文件结构 1 Java虚拟机的两种中立特性     · 平台无关性     · 语言无关性     实现平台无关性和语言无关性的基础是虚拟机和字节码存储格式(Class文件).   2 Clas ...

  8. 深入理解Java虚拟机读书笔记1----Java内存区域与HotSpot虚拟机对象

    一 Java内存区域与HotSpot虚拟机对象 1 Java技术体系.JDK.JRE?     Java技术体系包括:         · Java程序设计语言:         · 各种硬件平台上的 ...

  9. 深入理解java虚拟机读书笔记1--java内存区域

    Java在执行Java程序的过程中会把它所管理的内存划分为若干个不同的数据区域.这些区域都有各自的用途.创建和销毁的时间,有一些是随虚拟机的启动而创建,随虚拟机的退出而销毁,有些则是与线程一一对应,随 ...

  10. 深入理解java虚拟机---读书笔记

    第一章 走近java 1. java 技术体系: java 程序设计语言 各种硬件平台上的java虚拟机 class 文件格式 java API 类库 来自商业机构或者开源机构的第三方java类库 j ...

随机推荐

  1. python读取配置文件报keyerror-文件路径不正确导致的错误

    - 在其他模块使用反射读取配置文件报错,但是在反射模块中读取GetData.check_list又是正确的 反射模块如下: # get_data.py from API_AUTO.p2p_projec ...

  2. 如果你的unordered_map头文件报错请看这里

    请将include<unordered_map>头文件换成下面代码 #if(__cplusplus == 201103L) #include <unordered_map> # ...

  3. mysql手动开启

    1.cd C:\Program Files\mysql-5.7.20-winx64\bin2.mysqld --install mysql5.73.net start mysql5.7

  4. Memcached笔记——(四)应对高并发攻击

    近半个月过得很痛苦,主要是产品上线后,引来无数机器用户恶意攻击,不停的刷新产品各个服务入口,制造垃圾数据,消耗资源.他们的最好成绩,1秒钟可以并发6次,赶在Database入库前,Cache进行Mis ...

  5. Luogu_2876_[USACO07JAN]解决问题Problem Solving

    题目描述 过去的日子里,农夫John的牛没有任何题目. 可是现在他们有题目,有很多的题目. 精确地说,他们有\(P(1 \leq P \leq 300)\)道题目要做. 他们还离开了农场并且象普通人一 ...

  6. zookeeper 单机部署

    第一步:下载安装包 这里以3.4.11为例  https://archive.apache.org/dist/zookeeper/ 点进去看: 下载tar文件 第二步:上传到服务器 使用ftp工具上传 ...

  7. 测试LFI WITH PHPINO过程中的一些记录

    原理:以往LFI漏洞都是需要满足两个条件:1.攻击者上传一个含PHP代码的的文件,后缀名任意,没有后缀名也可以:2.需要知道上传后的文件路径及文件名,然后包含之. 后来有国外研究者发现了新的攻击方式, ...

  8. Spark OFF_HEP变迁

    在文章的开头,安利一下我自己的github上的一个项目:AlluxioBlockManager,同时还有我的github上的博客:blog这个项目的作用是替代Spark2.0以前默认的TachyonB ...

  9. Spring-cloud微服务实战【十】:消息总线Bus

      回忆一下,在上一篇文章中,我们使用了分布式配置中心config来管理所有微服务的配置文件,那这样有没有什么问题?有,那就是无法配置文件无法自动更新,当我的git服务器上的配置文件更新后,不能同步更 ...

  10. Python2.7错误处理FileNotFoundError报错NameError: name 'FileNotFoundError' is not defined

    错误信息如下: 原因是FileNotFoundError是python3.0中的写法,而Python2.7中应写为IOError.