String 既然能做性能调优,我直呼内行
码哥,String 还能优化啥?你是不是框我?
莫慌,今天给大家见识一下不一样的 String,从根上拿捏直达 G 点。
并且码哥分享一个例子:通过性能调优我们能实现百兆内存轻松存储几十 G 数据。
String
对象是我们每天都「摸」的对象类型,但是她的性能问题我们却总是忽略。
爱她,不能只会简单一起玩耍,要深入了解String
的内心深处,做一个「心有猛虎,细嗅蔷薇」的暖男。
通过以下几点分析,我们一步步揭开她的衣裳,直达内心深处,提升一个 Level,让 String
直接起飞:
- 字符串对象的特性;
- String 的不可变性;
- 大字符串构建技巧;
- String.intern 节省内存;
- 字符串分割技巧;
String 身体解密
想要深入了解,就先从基本组成开始……
「String 缔造者」对 String
对象做了大量优化来节省内存,从而提升 String 的性能:
Java 6 及之前
数据存储在 char[]
数组中,String
通过 offset
和 count
两个属性定位 char[]
数据获取字符串。
这样可以高效快速的定位并共享数组对象,并且节省内存,但是有可能导致内存泄漏。
共享 char 数组为啥可能会导致内存泄漏呢?
String(int offset, int count, char value[]) {
this.value = value;
this.offset = offset;
this.count = count;
}
public String substring(int beginIndex, int endIndex) {
//check boundary
return new String(offset + beginIndex, endIndex - beginIndex, value);
}
调用 substring()
的时候虽然创建了新的字符串,但字符串的值 value
仍然指向的是内存中的同一个数组,如下图所示:
如果我们仅仅是用 substring
获取一小段字符,而原始 string
字符串非常大的情况下,substring 的对象如果一直被引用。
此时 String
字符串也无法回收,从而导致内存泄露。
如果有大量这种通过 substring 获取超大字符串中一小段字符串的操作,会因为内存泄露而导致内存溢出。
JDK7、8
去掉了 offset
和 count
两个变量,减少了 String 对象占用的内存。
substring 源码:
public String(char value[], int offset, int count) {
this.value = Arrays.copyOfRange(value, offset, offset + count);
}
public String substring(int beginIndex, int endIndex) {
int subLen = endIndex - beginIndex;
return new String(value, beginIndex, subLen);
}
substring()
通过 new String()
返回了一个新的字符串对象,在创建新的对象时通过 Arrays.copyOfRange()
深度拷贝了一个新的字符数组。
如下图所示:
String.substring 方法不再共享 char[]
数组的数据,解决了可能内存泄漏的问题。
Java 9
将 char[]
字段改为 byte[]
,新增 coder
属性。
码哥,为什么这么改呢?
一个 char 字符占 2 个字节,16 位。存储单字节编码内的字符(占一个字节的字符)就显得非常浪费。
为了节约内存空间,于是使用了 1 个字节占 8 位的 byte 数组来存放字符串。
勤俭节约的女神,谁不爱……
新属性 coder 的作用是:在计算字符串长度或者使用 indexOf()
方法时,我们需要根据编码类型来计算字符串长度。
coder 的值分别表示不同编码类型:
- 0:表示使用
Latin-1
(单字节编码); - 1:使用
UTF-16
。
String 的不可变性
了解了String
的基本组成之后,发现 String 还有一个比外在更性感的特性,她被 final
关键字修饰,char 数组也是。
我们知道类被 final 修饰代表该类不可继承,而 char[]
被 final+private
修饰,代表了 String
对象不可被更改。
String 对象一旦创建成功,就不能再对它进行改变。
final 修饰的好处
安全性
当你在调用其他方法时,比如调用一些系统级操作指令之前,可能会有一系列校验。
如果是可变类的话,可能在你校验过后,它的内部的值又被改变了,这样有可能会引起严重的系统崩溃问题。
高性能缓存
String
不可变之后就能保证 hash
值得唯一性,使得类似 HashMap
容器才能实现相应的 key-value
缓存功能。
实现字符串常量池
由于不可变,才得以实现字符串常量池。
字符串常量池指的是在创建字符串的时候,先去「常量池」查找是否创建过该「字符串」;
如果有,则不会开辟新空间创建字符串,而是直接把常量池中该字符串的引用返回给此对象。
创建字符串的两种方式:
- String str1 = “码哥字节”;
- String str2 = new String(“码哥字节”);
当代码中使用第一种方式创建字符串对象时,JVM 首先会检查该对象是否在字符串常量池中,如果在,就返回该对象引用。
否则新的字符串将在常量池中被创建,并返回该引用。
这样可以减少同一个值的字符串对象的重复创建,节约内存。
第二种方式创建,在编译类文件时,"码哥字节" 字符串将会放入到常量结构中,在类加载时,“码哥字节" 将会在常量池中创建;
在调用 new 时,JVM 命令将会调用 String 的构造函数,在堆内存中创建一个 String 对象,同时该对象指向「常量池」中的“码哥字节”字符串,str 指向刚刚在堆上创建的 String 对象;
如下图:
什么是对象和对象引用呀?
str 属于方法栈的字面量,它指向堆中的 String 对象,并不是对象本。
对象在内存中是一块内存地址,str 则是指向这个内存地址的引用。
也就是说 str 并不是对象,而只是一个对象引用。
码哥,字符串的不可变到底指的是什么呀?
String str = "Java";
str = "Java,yyds"
第一次赋值 「Java」,第二次赋值「Java,yyds」,str 值确实改变了,为什么我还说 String 对象不可变呢?
这是因为 str 只是 String 对象的引用,并不是对象本身。
真正的对象依然还在内存中,没有被改变。
优化实战
了解了 String 的对象实现原理和特性,是时候要深入女神内心,结合实际场景,如何更上一层楼优化 String 对象的使用。
大字符串如何构建
既然 String 对象是不可变,所以我们在频繁拼接字符串的时候是否意味着创建多个对象呢?
String str = "癞蛤蟆撩青蛙" + "长的丑" + "玩的花";
是不是以为先生成「癞蛤蟆撩青蛙」对象,再生成「癞蛤蟆撩青蛙长的丑」对象,最后生成「癞蛤蟆撩青蛙长得丑玩的花」对象。
实际运行中,只有一个对象生成。
这是为什么呢?
虽然代码写的丑陋,但是编译器自动优化了代码。
再看下面例子:
String str = "小青蛙";
for(int i=0; i<1000; i++) {
str += i;
}
上面的代码编译后,你可以看到编译器同样对这段代码进行了优化。
Java 在进行字符串的拼接时,偏向使用 StringBuilder,这样可以提高程序的效率。
String str = "小青蛙";
for(int i=0; i<1000; i++) {
str = (new StringBuilder(String.valueOf(str))).append(i).toString();
}
即使如此,还是循环内重复创建 StringBuilder
对象。
敲黑板
所以做字符串拼接的时候,我建议你还是要显示地使用 String Builder 来提升系统性能。
如果在多线程编程中,String 对象的拼接涉及到线程安全,你可以使用 StringBuffer。
运用 intern 节省内存
直接看intern()
方法的定义与源码:
intern()
是一个本地方法,它的定义中说的是,当调用 intern
方法时,如果字符串常量池中已经包含此字符串,则直接返回此字符串的引用。
否则将此字符串添加到常量池中,并返回字符串的引用。
如果不包含此字符串,先将字符串添加到常量池中,再返回此对象的引用。
什么情况下适合使用
intern()
方法?
Twitter 工程师曾分享过一个 String.intern()
的使用示例,Twitter 每次发布消息状态的时候,都会产生一个地址信息,以当时 Twitter 用户的规模预估,服务器需要 20G 的内存来存储地址信息。
public class Location {
private String city;
private String region;
private String countryCode;
private double longitude;
private double latitude;
}
考虑到其中有很多用户在地址信息上是有重合的,比如,国家、省份、城市等,这时就可以将这部分信息单独列出一个类,以减少重复,代码如下:
public class SharedLocation {
private String city;
private String region;
private String countryCode;
}
public class Location {
private SharedLocation sharedLocation;
double longitude;
double latitude;
}
通过优化,数据存储大小减到了 20G 左右。
但对于内存存储这个数据来说,依然很大,怎么办呢?
Twitter 工程师使用 String.intern()
使重复性非常高的地址信息存储大小从 20G 降到几百兆,从而优化了 String 对象的存储。
核心代码如下:
SharedLocation sharedLocation = new SharedLocation();
sharedLocation.setCity(messageInfo.getCity().intern());
sharedLocation.setCountryCode(messageInfo.getRegion().intern());
sharedLocation.setRegion(messageInfo.getCountryCode().intern());
弄个简单例子方便理解:
String a =new String("abc").intern();
String b = new String("abc").intern();
System.out.print(a==b);
输出结果:true
。
在加载类的时候会在常量池中创建一个字符串对象,内容是「abc」。
创建局部 a 变量时,调用 new Sting() 会在堆内存中创建一个 String 对象,String 对象中的 char 数组将会引用常量池中字符串。
在调用 intern 方法之后,会去常量池中查找是否有等于该字符串对象的引用,有就返回引用。
创建 b 变量时,调用 new Sting() 会在堆内存中创建一个 String 对象,String 对象中的 char 数组将会引用常量池中字符串。
在调用 intern 方法之后,会去常量池中查找是否有等于该字符串对象的引用,有就返回引用给局部变量。
而刚在堆内存中的两个对象,由于没有引用指向它,将会被垃圾回收。
所以 a 和 b 引用的是同一个对象。
字符串分割有妙招
Split() 方法使用了正则表达式实现了其强大的分割功能,而正则表达式的性能是非常不稳定的。
使用不恰当会引起回溯问题,很可能导致 CPU 居高不下。
Java 正则表达式使用的引擎实现是 NFA(Non deterministic Finite Automaton,确定型有穷自动机)自动机,这种正则表达式引擎在进行字符匹配时会发生回溯(backtracking),而一旦发生回溯,那其消耗的时间就会变得很长,有可能是几分钟,也有可能是几个小时,时间长短取决于回溯的次数和复杂度。
所以我们应该慎重使用 Split()
方法,我们可以用String.indexOf()
方法代替 Split()
方法完成字符串的分割。
总结与思考
我们从 String 进化历程掌握了她的组成,不断的改变成员变量节约内存。
她的不可变性从而实现了字符串常量池,减少同一个字符串的重复创建,节约内存。
但也是因为这个特性,我们在做长字符串拼接时,需要显示使用 StringBuilder,以提高字符串的拼接性能。
最后,在优化方面,我们还可以使用 intern 方法,让变量字符串对象重复使用常量池中相同值的对象,进而节约内存。
最后,出一个问题给大家,欢迎在评论区留言,点赞对多的将获取码哥赠送的书籍。
通过三种不同的方式创建了三个对象,再依次两两匹配,每组被匹配的两个对象是否相等?代码如下:
String str1 = "abc";
String str2 = new String("abc");
String str3 = str2.intern();
assertSame(str1 == str2);
assertSame(str2 == str3);
assertSame(str1 == str3)
公zhong号后台回复:「String」获取答案。
String 既然能做性能调优,我直呼内行的更多相关文章
- iOS-------应用性能调优的25个建议和技巧
性能对 iOS 应用的开发尤其重要,如果你的应用失去反应或者很慢,失望的用户会把他们的失望写满App Store的评论.然而由于iOS设备的限制,有时搞好性能是一件难事.开发过程中你会有很多需要注意的 ...
- iOS应用性能调优建议
本文来自iOS Tutorial Team 的 Marcelo Fabri,他是Movile的一名 iOS 程序员.这是他的个人网站:http://www.marcelofabri.com/,你还可以 ...
- iOS应用性能调优的25个建议和技巧
本文来自iOS Tutorial Team 的 Marcelo Fabri,他是Movile的一名 iOS 程序员.这是他的个人网站:http://www.marcelofabri.com/,你还可以 ...
- Java性能调优笔记
Java性能调优笔记 调优步骤:衡量系统现状.设定调优目标.寻找性能瓶颈.性能调优.衡量是否到达目标(如果未到达目标,需重新寻找性能瓶颈).性能调优结束. 寻找性能瓶颈 性能瓶颈的表象:资源消耗过多. ...
- [转]iOS应用性能调优的25个建议和技巧
写在前面 本文来自iOS Tutorial Team 的 Marcelo Fabri,他是Movile的一名 iOS 程序员.这是他的个人网站:http://www.marcelofabri.com/ ...
- PHP 性能分析第三篇: 性能调优实战
注意:本文是我们的 PHP 性能分析系列的第三篇,点此阅读 PHP 性能分析第一篇: XHProf & XHGui 介绍 ,或 PHP 性能分析第二篇: 深入研究 XHGui. 在本系列的 ...
- iOS性能调优
写在前面 本文来自iOS Tutorial Team 的 Marcelo Fabri,他是Movile的一名 iOS 程序员.这是他的个人网站:http://www.marcelofabri.com/ ...
- 【Xamarin挖墙脚系列:应用的性能调优】
原文:[Xamarin挖墙脚系列:应用的性能调优] 官方提供的工具:网盘地址:http://pan.baidu.com/s/1pKgrsrp 官方下载地址:https://download.xamar ...
- iOS应用性能调优的25个建议和技巧【转】
转载自:http://blog.jobbole.com/37984/ 首页 最新文章 资讯 程序员 设计 IT技术 创业 在国外 营销 趣文 特别分享 更多 > - Navigation - ...
随机推荐
- 什么是微服务,SpringBoot和SpringCloud的关系和区别
什么是微服务? 就目前而言对于微服务业界没有一个统一的,标准的定义.但通常而言,微服务是一种架构模式或者说是一种架构风格,它提倡单一应用程序划分为一组小的服务,每个服务在其独立的自己的进程中,服务之间 ...
- 错误: 找不到或无法加载主类(IDEA中启动spring boot项目)
版权声明:本文为博主原创文章,如果转载请给出原文链接:http://www.jufanshare.com/content/142.html 提示:需要对IDEA编辑工具使用熟悉 出现一个问题,就是sp ...
- 【C#】【MySQL】C#连接MySQL数据库(一)代码
C#连接MySQL数据库 准备工作 1.环境安装 安装MySQL For Visual Studio<<点击进入官网下载 第一个要下载安装,第二个下载后将MySQL.data添加到Visu ...
- KrakenD url匹配通配符 url_pattern wildcard
KrakenD是一个高性能Api网关, api转发的推荐做法是每个api一个配置项,也就是一个endpoint,其开发者认为api网关和纯粹的L7路由不一样(文章链接). 因此社区版并没有提供通配符 ...
- 什么是JMS规范?
一.简介 JMS是什么:JMS是Java提供的一套技术规范和关于消息中间件的协议 JMS干什么用:通过生产者Producer,消息服务器,以及消费者通力合作,使异构系统能进行集成通信,缓解系统瓶颈,提 ...
- SimpleCursorAdapter 原理和实例
SimpleCursorAdapter 1. 原理参见下面代码注释 Cursor cursor = dbHelper.fetchAllCountries(); //cursor中存储需要加载到list ...
- 共享资源库(Project)
<Project2016 企业项目管理实践>张会斌 董方好 编著 既然要共享资源库,那就得先建一个可供共享的资源库文件,好吧,说得这么高大上,其实就是一个里面只有资源数据的mpp项目文件, ...
- CF1445B Elimination 题解
Content 一个比赛分两场进行,其中: 第一场的第一百名成绩为 \(a\),且第一场的前一百名在第二场中都至少得到了 \(b\) 分. 第二场的第一百名成绩为 \(c\),且第二场的前一百名在第一 ...
- SpringBoot基础篇(一)
1.前言 什么是SpringBoot:springboot是当下一套流行的J2EE框架.借助微服务的思想.将业务分成一个个的服务.通过spring-cloud进行整合.最后通过spring-data进 ...
- html5调用摄像头截图
关于html5调用音视频等多媒体硬件的API已经很成熟,不过一直找不到机会把这些硬件转化为实际的应用场景,不过近年来随着iot和AI的浪潮,我觉得软硬结合的时机已经成熟.那我们就提前熟悉下怎么操作这些 ...