java基础(八) 深入解析常量池与装拆箱机制
引言
本文将介绍常量池 与 装箱拆箱机制,之所以将两者合在一起介绍,是因为网上不少文章在谈到常量池时,将包装类的缓存机制,java常量池,不加区别地混在一起讨论,更有甚者完全将这两者视为一个整体,给初学者带来不少困扰,我就是过来的。同时,也因为包装类的缓存 与 字符串常量池的思想是一样的,很容易混淆,但是实现方式是不一样的。
一、常量池
在介绍常量池前,先来介绍一下常量、字面常量、符号常量的定义。
常量 可分为 字面常量(也称为直接常量)和 符号常量。
字面常量: 是指在程序中无需预先定义就可使用的数字、字符、boolen值、字符串等。简单的说,就是确定值的本身。如 10,2L,2.3f,3.5,“hello”,'a',true、false、null 等等。
符号常量: 是指在程序中用标识符预先定义的,其值在程序中不可改变的量。如 final int a = 5;
常量池
常量池引入的 目的 是为了避免频繁的创建和销毁对象而影响系统性能,其实现了对象的共享。这是一种 享元模式 的实现。
二、 java常量池
Java的常量池可以细分为以下三类:
- class文件常量池(又称静态常量池,编译阶段)
- 运行时常量池(又称动态常量池,运行阶段)
- 字符串常量池(全局的常量池)
1. class文件常量池
class文件常量池,也被称为 静态常量池 ,它是.class文件所包含的一项信息。用于存放编译器生成的各种字面量(Literal)和符号引用(Symbolic References)。
常量池在.class文件的位置
字面量: 就是上面所说的字面常量。
符号引用: 是一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能无歧义地定位到目标即可(它与直接引用区分一下,直接引用 一般是指向方法区的本地指针,相对偏移量或是一个能间接定位到目标的句柄)。符号引用可以看作是一个虚拟地址,只有在JVM加载完类,确认了字面量的地址,才会将 符号引用 换成 直接引用。一般包括下面三类常量:
- 类和接口的全限定名
- 字段的名称和描述符
- 方法的名称和描述符
常量池的信息
想深入了解静态常量池,可以参考下面三篇文章:
2. 运行时常量池
运行时常量池,又称为 动态常量池 ,是JVM在完成加载类之后将class文件中常量池载入到内存中,并保存在方法区中。也就是说,运行时常量池中的常量,基本来源于各个class文件中的常量池。 运行时常量池相对于CLass文件常量池的另外一个重要特征是具备 动态性 ,Java语言并不要求常量一定只有编译期才能产生,也就是并非预置入CLass文件中常量池的内容才能进入方法区运行时常量池,运行期间也可能将新的常量放入池中,这种特性被开发人员利用比较多的就是String类的intern()方法。
jvm在执行某个类的时候,必须经过加载、连接、初始化,而连接又包括验证、准备、解析三个阶段。而当类加载到内存中后,jvm就会将class常量池中的内容存放到运行时常量池中,也就是说,每个class对应运行时常量池中的一个独立空间,每个class文件存放的位置互不干扰。而在解析阶段,就会将符号引用替换成对应的直接引用。
不过,String类型 的字面常量要注意:并不是直接在堆上分配空间来创建对象的,JVM为String 字符串额外维护了一个常量池 字符串常量池,所以遇到字符串常量是要先去字符串池中寻找是否有重复,如果有,则返回对应的引用。否则,才创建并添加到字符串常量池中。换句话说,对于String类型的字面常量,必须要在 字符串常量池 中维护一个全局的引用。
3. 字符串常量池(string pool也有叫做string literal pool)
字符串常量池存储的就是字符串的字面常量。详细一点,字符串常量池里的内容是在类加载完成,经过验证,准备阶段之后在堆中生成字符串对象实例,然后将该字符串对象实例的引用值存到string pool中(记住:string pool中存的是引用值而不是具体的实例对象,具体的实例对象是在堆中开辟的一块空间存放的。)。
在HotSpot VM里实现的string pool功能的是一个StringTable类,它是一个哈希表,里面存的是驻留字符串(也就是我们常说的用双引号括起来的)的引用(而不是驻留字符串实例本身),也就是说在堆中的某些字符串实例被这个StringTable引用之后就等同被赋予了”驻留字符串”的身份。这个StringTable在每个HotSpot VM的实例只有一份,被所有的类共享。
运行时常量池 与 字符串常量池 的区别
字符串常量池是位于运行时常量池中的。
网上有不少文章是将字符串常量池作为运行时常量池同等来说,我一开始也以为这两者就是同一个东西,其实不然。运行时常量池 与 字符串常量池 在HotSpot的JDK1.6以前,都是放在方法区的,JDK1.7就将字符串常量池移到了堆外内存中去。运行时常量池 为每一个Class文件的常量池提供一个运行时的内存空间;而字符串常量池则为所有Class文件的String类型的字面常量维护一个公共的常量池,也就是Class文件的常量池加载进运行时常量池后,其String字面常量的引用指向要与字符串常量池的维护的要一致。
我们来几个例子理解一下常量池
@ Example 1 简单的例子
public class Test_6 {
public static void main(String[] args) {
String str = "Hello World!";
}
}
我们使用使用javap -v MyTest.class 查看class文件的字节码,经javap 处理可以输出我们能看懂的信息。如下图:
class文件的索引#16位置(第16个常量池项)存储的是 一个描述了字符串字面常量信息(类型,以及内容索引)的数据结构体,这个结构体被称为CONSTANT_String_info
。这个结构体并没有存储字符串的内容,而是存储了一个指向字符串内容的索引--#17,即第17项存储的是Hello World
的二进制码。
@ Example 2 String的+运算例子
我们再来看一个比较复杂的例子
public class Test_6 {
public static void main(String[] args) {
String str_aa = "Love";
String str_bb = "beautiful" + " girl";
String str_cc = str_aa+" China";
}
}
同样,查看class文件的字节码信息:
class文件的常量池保存了Love
、beautiful girl
、China
,但却没有 Love China
。为什么 str_bb 与 str_cc 都是通过 + 链接得到的,为什么str_cc的值没有出现在常量池中,而str_bb的值却出现了。
这是因为str_bb的值是由两个常量计算得到的,这种只有常量的表达式计算在编译期间由编译器计算得到的,要记住,能由编译器完成的计算,就不会拖到运行期间来计算。
而str_cc的计算中包含了变量str_aa,涉及到变量的表达式计算都是在运行期间计算的,因为变量是无法在编译期间确定它的值,特别是多线程下,同时得到结果是CPU动态分配空间存储的,也就是说地址也无法确定。我们再去细看,就会发现常量池中的包含了StringBuilder
以及其方法的描述信息,其实,这个StringBuilder
是为了计算str_aa+" China"
表达式,先调用append()
方法,添加两个字符串,在调用toString()
方法,返回结果。也就是说,在运行期间,String字符串通过 + 来链接的表达式计算都是通过创建StringBuilder来完成的
@ Example 3 String新建对象例子
下面的例子,str_bb的值是直接通过new新建一个对象,观察静态常量池。
public class MyTest {
public static void main(String[] args) {
String str_bb = new String("Hello");
}
}
查看对应class文件的字节码信息:
通过new新建对象的操作是在运行期间才完成的,为什么这里仍旧在class文件的常量池中出现呢?这是因为"Hello"
本身就是一个字面常量,这是很容易让人忽略的。有双引号包裹的都是字面常量。同时,new创建一个String字符串对象,确实是在运行时完成的,但这个对象将不同于字符串常量池中所维护的常量。
二、自动装箱拆箱机制 与 缓存机制
先来简单介绍一下自动装箱拆箱机制
1、自动装拆箱机制介绍
装箱: 可以自动将基本类型直接转换成对应的包装类型。
拆箱: 自动将包装类型转换成对应的基本类型值;
//普通的创建对象方式
Integer a = new Integer(5);
//装箱
Integer b = 5;
//拆箱
int c = b+5;
2. 自动装箱拆箱的原理
装箱拆箱究竟是是怎么实现,感觉有点神奇,居然可以使基本类型与包装类型快速转换。我们再稍微简化上面的例子:
public class Test_6 {
public static void main(String[] args) {
//装箱
Integer b = 5;
//拆箱
int c = b+5;
}
}
依旧使用 javap -v Test_6.class 查看这个类的class文件的字节码信息,如下图:
可以从class的字节码发现,静态常量池中,由Integer.valueOf()
和 Integer.initValue()
这两个方法的描述。这就有点奇怪,例子中的代码中并没有调用这两个方法,为什么编译后会出现呢?
感觉还是不够清晰,我们换另一种反编译工具来反编译一下,这次我们反编译回java代码,使用命令 jad Test_6.class ,得到的反编译代码如下:
public class Test_6
{
public static void main(String args[])
{
Integer b = Integer.valueOf(5);
int c = b.intValue() + 5;
}
}
这回就非常直观明了了。所谓装箱拆箱并没有多厉害,还是要通过调用Integer.valueOf()
(装箱) 和 Integer.initValue()
(拆箱)来完成的。也就是说,自动装箱拆箱机制是一种语法简写,为了方便程序员,省去了手动装箱拆箱的麻烦,变成了自动装箱拆箱
判别是装箱还是拆箱
在下面的两个例子中,可能会让你很迷惑:不知道到底使用了装箱,还是使用了拆箱。
Integer x = 1;
Integer y = 2;
Integer z = x+y;
这种情况其实只要仔细想一下便可以知道:这是 先拆箱再装箱。因为Integer类型是引用类型,所以不能参与加法运算,必须拆箱成基本类型来求和,在装箱成Integer。如果改造上面的例子,把Integer变成Short,则正确代码如下:
Short a = 5;
Short b = 6;
Short c = (short) (a+b);
再看另一种情况:
3. 包装类的缓存机制
我们先来看一个例子
public class MyTest {
public static void main(String[] args) {
Integer a = 5;
Integer b = 5;
Integer c = 129;
Integer d = 129;
System.out.println("a==b "+ (a == b));
System.out.println("c==d "+ (c == d));
}
}
运行结果:
a == b true
c == d false
咦,为什么是a和b所指向的是一个对象呢?难道JVM在类加载时也为包装类型维护了一个常量池?如果是这样,为什么变量c、d的地址不一样。事实上,JVM确实没有为包装类维护一个常量池。变量a、b、c、d是由装箱得到的,根据前面所说的,装箱其实是编译器自动添加了Integer.valueOf()
方法。秘密应该就在这个方法内,那么我们看一下Integer.valueOf()
的源代码吧,如下:
public static Integer valueOf(int i) {
if (i >= IntegerCache.low && i <= IntegerCache.high)
return IntegerCache.cache[i + (-IntegerCache.low)];
return new Integer(i);
}
代码很简单,判断装箱所使用的基本类型值是否在 [ IntegerCache.low
, IntegerCache.high
] 的范围内,如果在,返回IntegerCache.cache
数组中对应下标的元素。否则,才新建一个对象。我们继续深入查看 IntegerCache
的源码,如下:
private static class IntegerCache {
static final int low = -128;
static final int high;
static final Integer cache[];
static {
// high value may be configured by property
int h = 127;
String integerCacheHighPropValue =
sun.misc.VM.getSavedProperty("java.lang.Integer.IntegerCache.high");
//获取上限值
if (integerCacheHighPropValue != null) {
try {
int i = parseInt(integerCacheHighPropValue);
i = Math.max(i, 127);
// Maximum array size is Integer.MAX_VALUE
h = Math.min(i, Integer.MAX_VALUE - (-low) -1);
} catch( NumberFormatException nfe) {
// If the property cannot be parsed into an int, ignore it.
}
}
high = h;
//创建数组
cache = new Integer[(high - low) + 1];
int j = low;
//填充数组
for(int k = 0; k < cache.length; k++)
cache[k] = new Integer(j++);
// range [-128, 127] must be interned (JLS7 5.1.7)
assert IntegerCache.high >= 127;
}
private IntegerCache() {}
}
从源码中,可以知道,IntegerCache.cache
是一个final的Integer数组,这个数组存储的Integer对象元素的值范围是[-128,127]。而且这个数组的初始化代码是包裹在static代码块中,也就是说IntegerCache.cache
数组的初始化是在类加载时完成的。
再看回上面的例子,变量a和b的使用的基本类型值为5,超出[-128,127]的范围,所以就使用缓存数组中的元素,所以a、b的地址是一样的。而c、d使用的基本类型值为129,超出缓存范围,所以都是各自在堆上创建一个对,地址自然就不一样了。
包装类缓存总结与补充:
- 包装类与String类很相似,都是非可变类,即一经创建后,便不可以修改。正因为这种特性,两者的对象实例在多线程下是安全的,不用担心异步修改的情况,这为他们实现共享提供了很好的保证,只需创建一个对象共享便可。
- 包装类的共享实现并不是由JVM来维护一个常量池,而是使用了缓存机制(数组),而且这个缓存是在类加载时完成初始化,并且不可再修改。
- 包装类的数组缓存范围是有限,只缓存基本类型值在一个字节范围内,也就是说 -128 ~ 127。(Character的范围是 0~127)
- 目前并不是所有包装类都提供缓存机制,只有Byte、Character、Short、Integer 4个包装类提供,Long、Float、Double 不提供。
参考文献:
java基础(八) 深入解析常量池与装拆箱机制的更多相关文章
- Java基础 带你深刻理解自动装箱,拆箱含义
1.什么是装箱,什么是拆箱装箱:把基本数据类型转换为包装类.拆箱:把包装类转换为基本数据类型.基本数据类型所对应的包装类:int(几个字节4)- Integerbyte(1)- Byteshort(2 ...
- java基础(八)-----深入解析java四种访问权限
Java中的访问权限理解起来不难,但完全掌握却不容易,特别是4种访问权限并不是任何时候都可以使用.下面整理一下,在什么情况下,有哪些访问权限可以允许选择. 一.访问权限简介 访问权限控制: 指的是本类 ...
- Java堆、栈和常量池以及相关String的详细讲解(经典中的经典) (转)
原文链接 : http://www.cnblogs.com/xiohao/p/4296088.html 一:在JAVA中,有六个不同的地方可以存储数据: 1. 寄存器(register). 这是最快的 ...
- Java堆、栈和常量池以及相关String的详细讲解
一:在JAVA中,有六个不同的地方可以存储数据: 1. 寄存器(register). 这是最快的存储区,因为它位于不同于其他存储区的地方——处理器内部.但是寄存器的数量极其有限,所以寄存器由编译器根据 ...
- Java中的String与常量池[转帖]
string是java中的字符串.String类是不可变的,对String类的任何改变,都是返回一个新的String类对象.下面介绍java中的String与常量池. 1. 首先String不属于8种 ...
- Java中的String与常量池
string是java中的字符串.String类是不可变的,对String类的任何改变,都是返回一个新的String类对象.下面介绍java中的String与常量池. 1. 首先String不属于8种 ...
- Java堆、栈和常量池以及相关String详解
一:在JAVA中,有六个不同的地方可以存储数据: 1. 寄存器(register). 这是最快的存储区,因为它位于不同于其他存储区的地方——处理器内部.但是寄存器的数量极其有限,所以寄存器由编译器根据 ...
- Java基础八--构造函数
Java基础八--构造函数 一.子父类中构造函数的特点 1.1 为什么在子类构造对象时,发现,访问子类构造函数时,父类也运行了呢? 原因是:在子类的构造函数中第一行有一个默认的隐式语句. super( ...
- Java堆、栈和常量池以及相关String的详细讲解(转)
一:在JAVA中,有六个不同的地方可以存储数据: 1. 寄存器(register). 这是最快的存储区,因为它位于不同于其他存储区的地方——处理器内部.但是寄存器的数量极其有限,所以寄存器由编译器根据 ...
随机推荐
- tensorflow初次接触记录,我用python写的tensorflow第一个模型
tensorflow初次接触记录,我用python写的tensorflow第一个模型 刚用python写的tensorflow机器学习代码,训练60000张手写文字图片,多层神经网络学习拟合17000 ...
- cat /proc/sys/net/ipv4/ip_forward 0 解决办法
[root@localhost java]# cat /proc/sys/net/ipv4/ip_forward 出于安全考虑,Linux系统默认是禁止数据包转发的. 所谓转发即当主机拥有多于一块的网 ...
- 手风琴图片和钢琴导航栏JQ滑动特效
手风琴JQ滑动特效 1.效果预览: 2.相关代码: <!DOCTYPE html> <html lang="en"> <head> <me ...
- TP中使用laravel那一套验证
---恢复内容开始--- 1,tp5项目下新建一个extends目录,同时在入口文件index.php配置 define('EXTEND_PATH', '../extend/'); 结果: 2,加载l ...
- Maven 映像
国内连接maven官方的仓库更新依赖库,网速一般很慢,收集一些国内快速的maven仓库镜像以备用. ====================国内OSChina提供的镜像,非常不错=========== ...
- ARM的体系结构与编程系列博客——ARM处理器系列介绍
ARM处理器系列介绍 现在到了3月,过年过得过于舒服了.系列博客也停更了近半月,我果然是个慢(lan)性(gui)子,那么趁着到校的第一天晚上,就写一篇博客来继续我的系列博客了!众所周知,ARM处理器 ...
- 把AspDotNetCoreMvc程序运行在Docker上-part4:实现负载均衡
在上一part<把AspDotNetCoreMvc程序运行在Docker上-part3:使用独立的存储容器>,我们利用MySql容器和Volume实现了真正意义上的数据存储.整个结构非常简 ...
- 学习ThinkPHP笔记
学习ThinkPHP笔记 TP的模块化设计 名称 描述 应用 基于同一个入口文件访问的项目我们称之为一个应用. 模块 一个应用下面可以包含多个模块,每个模块在应用目录下面都是一个独立的子目录. 控制器 ...
- 2013年8月12日Python的5个最有价值问题
问:Python怎么在字典里删除值但保留相应的键 答: 假设3都在值里,而非键>>> for v in D1.values():... if 3 in v:... ...
- Ionic APP 热更新
开门见山,本文主题:cordova-hot-code-push 作用:cordova热更新插件,提供了在应用程序中对基于Web的内容进行自动更新的功能. GitHub地址:https://github ...