前言

逛知乎遇到一个刚学Java就会接触的字符串比较问题:



通常,根据"==比较的是地址,equals比较的是值"介个定理就能得到结果。但是String有些特殊,通过new String(string)生成的两个同值的字符串地址就不相等,用其他方式来生成的两个同值字符串地址就相等。

代码如下:

	// 第一种方式创建字符串,字面量赋值
String str1 = "abc";
String str2 = "abc";
// 第二种方式创建字符串
String str3 = new String("xyz");
String str4 = new String("xyz");
System.out.println(str1 == str2); //true
System.out.println(str3 == str4); //false

同样是创建字符串,两对等值的字符串进行为什么结果不一样,这就涉及到了常量池和堆。

第一种方式创建的字符串,会将"abc"这个字面量放到了常量池中,然后str1和str2都指向常量池中的"abc",所以两个变量地址相同;第二种方式创建的字符串,是先在常量池中放入"xyz",然后通过构造函数将常量池中的"xyz"拷贝一份到堆中生成新的String,和常量池中的"xyx"就没有了关系,所以两个变量指向的是堆中两个不同的变量,所以两个变量地址不同。

那intern()又是啥?和常量池之间又有什么联系?

常量池

常量池是存放字面量、符号引用或直接引用的地方。而常量池又分为class常量池和运行时常量池。

class常量池

class常量池是存放编译期类中的字面量和符号引用。上面的字符串"abc"就是字面量;符号引用就是类和接口的完全限定名,字段的名称和描述符,方法的名称和描述符。

如图:



图中的就是new String(String)这个方法在常量池中的名称和描述符,即符号引用。

运行时常量池

我们平时说的常量池指的就是运行时常量池。在类加载的解析阶段,会将class常量池载入内存中(JDK1.7之前位于方法区,现在位于Heap中),并且将符号引用解析成直接引用,即根据对方法/类的描述信息指向内存中对应的方法/类。运行时常量池具有动态性,可以在运行期添加新的变量进入常量池。

intern()

先看一下intern()这个方法的描述:

用二级英文水平翻译一波,大意就是一个string调用intern()的时候,如果池中有和这个字符串值相等的字符串对象,就会将字符串池中的字符串对象返回;如果没有,就将这个字符串添加进去,并返回这个字符串的引用。字符串池由String类私有维护。

这里又引入了字符串池这个概念。

字符串池

字符串池存放的是常量池中字符串对象的引用,而不是字符串对象。通过第一种字面量赋值法创建的字符串会放在常量池中,字符串池就会存储这个字符串对象的引用,当再次在常量池创建字符串时,会先从字符串池查看是否有此字符串的等值引用,如果有的话,直接指向此引用对应的对象。

而第二种方式创建的字符串,会在字符串池中查找是否有与构造参数等值的字符串,以此决定是否需要在常量池新建字符串,然后拷贝常量池中字符串在Heap创建一个新的字符串。



如图,在堆中会在常量池中创建一个名为original的新字符串,然后拷贝并在堆中生成一个新字符串。注释中也提到,除非你需要一个字符串的显式副本,否则不需要使用这个构造函数,因为字符串是不可变的。

这里使用intern()测试一下字符串池:

    public static void main(String[] args) {
//第一部分 测试
String str1 = "abc";
String str2 = new String("abc");
System.out.println(str1.intern() == str1); //true
System.out.println(str1.intern() == str2); //false
System.out.println(str1.intern() == str2.intern()); //true
//第二部分 测试通过char[]创建字符串后,引用是否会进入字符串池
String str3 = new String(new char[]{'g', 'h'});
String str4 = "gh";
System.out.println(str3.intern() == str3); //false
System.out.println(str3.intern() == str4); //true
//第三部分 测试char[]创建的字符串调用intern()后引用是否进入字符串池
String str3 = new String(new char[]{'g', 'h'});
str3.intern();
String str4 = "gh";
System.out.println(str3.intern() == str3); //true
System.out.println(str3.intern() == str4); //true
}

以上三部分代码是独立测试。

第一部分:str1在常量池创建了abc,并将引用放入字符串池,str2拷贝常量池中的abc并在堆中创建新字符串。intern()从字符串池中获取的是常量池中str1的abc引用。

第二部分:str3通过char[]在堆中创建了字符串,不是在常量池,所以gh的引用不会自动放入字符串池。str4在常量池创建了gh,所以字符串池中保存了str4的gh引用。intern()从字符串池中获取的是常量池中str4的gh引用。

第三部分:str3通过char[]在堆中创建了字符串,不是在常量池,所以gh的引用不会自动放入字符串池,但是它调用intern()手动将str3的gh的引用添加到了字符串池中。当str4使用字面量赋值创建时,查询到字符串池中有gh的引用,str4就指向了str3的gh引用。intern()从字符串池中获取的是堆中str3的gh引用。

从上面的代码中也得出结论:​intern()可以将堆中创建的且字符串池没有等值引用的字符串引用放入字符串池。

同时,这也能说明String为什么不可变这个问题。

因为这样可以保证多个引用可以同时指向字符串池中的同一个对象。如果字符串是可变的,其中的一个引用操作改变了对象的值,对其他引用会有影响,这样显然是不可以的。

言归正传

回到知乎上的问题。在常量池创建了"string"并将其引用放入字符串池,str1调用intern()返回的是常量池中的引用,而str1指向的是堆中的引用,所以输出为false。

而StringBuilder的toString()是通过char[]创建字符串:



在堆中创建了abcdef之后,str2调用intern()将堆中引用放入字符串池并返回此引用,与str2指向堆中同一个字符串对象,所以输出为true。

结语

Java中有时候很小的问题也会发散出很多知识点,不论是底层还是JVM的理论学习,结合应用案例会理解的更加深刻。就像文中提到的常量池就是class文件结构和类加载理论学习的一部分。

从Java的字符串池、常量池理解String的intern()的更多相关文章

  1. 从字符串到常量池,一文看懂String类设计

    从一道面试题开始 看到这个标题,你肯定以为我又要讲这道面试题了 // 这行代码创建了几个对象? String s3 = new String("1"); 是的,没错,我确实要从这里 ...

  2. Java提高篇之常量池

    一.相关概念 1. 什么是常量 用final修饰的成员变量表示常量,值一旦给定就无法改变! final修饰的变量有三种:静态变量.实例变量和局部变量,分别表示三种类型的常量. 2. Class文件中的 ...

  3. Java基础系列2:深入理解String类

    Java基础系列2:深入理解String类 String是Java中最为常用的数据类型之一,也是面试中比较常被问到的基础知识点,本篇就聊聊Java中的String.主要包括如下的五个内容: Strin ...

  4. 【JVM】Java 8 中的常量池、字符串池、包装类对象池

    1 - 引言 2 - 常量池 2.1 你真的懂 Java的“字面量”和“常量”吗? 2.2 常量和静态/运行时常量池有什么关系?什么是常量池? 2.3 字节码下的常量池以及常量池的加载机制 2.4 是 ...

  5. Java中几种常量池的区分

    转载自:https://tangxman.github.io/2015/07/27/the-difference-of-java-string-pool/ 在java的内存分配中,经常听到很多关于常量 ...

  6. java虚拟(一)--java内存区域和常量池概念

    一.java运行时数据区 也可以称为java内存区域,和java内存模型不是一回事,不要弄混,这里基于jdk1.8之前 1.1.方法区 线程共享,类装载过程中产生的java.lang.Class对象保 ...

  7. Java内存中的常量池

    1,java内存模型简介 <深入理解java虚拟机>里将java内存分为如下五个模块: 堆-堆是所有线程共享的,主要用来存储对象. 其中,堆可分为:新生代和老年代两块区域.使用NewRat ...

  8. String字符串针对常量池的优化

    String对象是java语言中重要的数据类型,但是不是基本数据类型.相对于c语言的char java做了一些封装和延伸. 针对常量池的优化:当两个String拥有相同的值时,它们只引用常量池中的同一 ...

  9. Java基础二:常量池

    目录: 自动装箱与拆箱 常量池 ==与equals()区别 1. 自动装箱与拆箱 Java是一个近乎纯洁的面向对象编程语言,但是为了编程的方便还是引入了基本数据类型,但是为了能够将这些基本数据类型当成 ...

随机推荐

  1. #2020征文-开发板#SYS_RUN()和MODULE_INIT()之间的那些事

    接触鸿蒙设备开发有一段时间了,也是时候好好挖一挖鸿蒙设备程序的启动流程了. 破冰问题:鸿蒙设备程序从哪里开始运行的? 相信大家都已经非常清楚了,鸿蒙设备程序需要指定入口函数,具体表现在代码层面就是通过 ...

  2. PCRE正则表达式语法

    字符 描述 \ 将下一个字符标记为一个特殊字符,或一个原义字符,或一个向后引用,或一个八进制转义符.例如,"\n"匹配一个换行符. ^ 匹配输入字符串的开始位置. $ 匹配输入字符 ...

  3. oracle ADG启动顺序

    一.oracle ADG启动顺序 1.启动主备库监听 [oracle@dgdb1 ~]$ lsnrctl start [oracle@dgdb2 ~]$ lsnrctl start   2.启动备库 ...

  4. matplotlib的学习13-subplot分格显示

    import matplotlib.pyplot as plt plt.figure()#创建一个图像窗口 # 使用plt.subplot2grid来创建第1个小图, (3,3)表示将整个图像窗口分成 ...

  5. Python之word文档替换字符串(也可以用于短模板套用)

    Python之word文档替换字符串(也可以用于短模板套用),代码如下: 1 ''' 2 #word模板套用1:创建模板,适合比较短的文档 3 ''' 4 5 #导入所需库 6 from docx i ...

  6. 解决误删/bin/bash问题

    出现原因:由于当时误操作把 /bin/bash 命令解释器二进制文件移到了/root 家目录里面,再重新登录系统之后,登陆进去什么也干干不了. 解决办法:让系统重启,以挂载光盘模式进入系统BIOS,选 ...

  7. 为什么线程安全的List推荐使用CopyOnWriteArrayList,而不是Vector

    注:本系列文章中用到的jdk版本均为java8 相比很多同学在刚接触Java集合的时候,线程安全的List用的一定是Vector.但是现在用到的线程安全的List一般都会用CopyOnWriteArr ...

  8. springMVC框架连接数据库查询数据

    1.框架搭建,创建一个maven项目打war包 web.xml文件 <?xml version="1.0" encoding="UTF-8"?> & ...

  9. 采购订单写入sap失败后,抛出自定义异常,回滚数据库

    @Transactional(rollbackFor = Exception.class) @Override public Map<String,Object> getOderInfo( ...

  10. pandas取前K大的数,sort_values()和nlargest()速度比较

    排序量比较大时: 数据量比较小时: 所以结论就是: 数据量大时选用nlargest,数据量小时选用sort_values() 具体数据量怎么算大:10000条时两个方法的时间差不多,所以可以按1000 ...