• 简介  

  String最为java中最重要的数据类型。字符串是软件开发中最重要的对象之一,通常,字符串对象在内存中总是占据着最大的空间块。所以,高效处理字符串,将提高系统的整个性能。  

  在java语言中,String对象可以认为是char数组的衍生和进一步的封装。它的主要组成部分是:char数组、偏移量和string的长度。char数组表示string的内容,它是string对象所表示字符串的超集。String的真实内容还需要偏移量和长度在这个char数组中进一步定位和截取。(查看java源代码可以看到char数组、偏移量和长度定义)

  String对象的三个基本特点:

  1、不变性;String对象一旦生成,则不能对它进行改变。String对象的这个特性可以泛指为不变模式,即一个对象的状态在对象被创建之后就不再发生变化。另外多说一点,不变模式主要作用在当一个对象需要被多线程共享,并且访问频繁时,可以省略同步和锁的等待时间,从而大幅度的提高系统的性能。

  2、针对常量池的优化;当两个string对象拥有相同的值的时候,他们只引用常量池中同一个拷贝。当同一个字符串反复出现时,可以大幅度的节省内存空间。

  3、类的final的定义。final类的String对象在系统中不可能有任何子类,这是对系统安全性的保护。

  String 类包括的方法可用于检查序列的单个字符、比较字符串、搜索字符串、提取子字符串、创建字符串副本并将所有字符全部转换为大写或小写等,熟练使用这些方法在企业开发中会有很大的帮助。

  • 截取子字符串

  截取子字符串是java中最常用的操作之一,在java中提供了两个截取子字符串的方法:

 substring(int beginIndex, int endIndex)
substring(int beginIndex)

  查看substring(int beginIndex, int endIndex)的源码:

 public String substring(int beginIndex, int endIndex) {
if (beginIndex < 0) {
throw new StringIndexOutOfBoundsException(beginIndex);
}
if (endIndex > value.length) {
throw new StringIndexOutOfBoundsException(endIndex);
}
int subLen = endIndex - beginIndex;
if (subLen < 0) {
throw new StringIndexOutOfBoundsException(subLen);
}
return ((beginIndex == 0) && (endIndex == value.length)) ? this
: new String(value, beginIndex, subLen);
}

  在方法的最后有一个返回一个新建的String对象,查看其构造函数:

 public String(char value[], int offset, int count) {
this.value=value,
this.offset=offset,
this.count=count
}

  在源码中,这是一个包作用域的构造函数,其目的是为了能高效且快速的共享String内的char数组对象。但是这种通过偏移量来截取字符串的方法中,String原生内容的value数组会被复制到新的子字符串中。设想,如果子字符串长度很短,但是原来字符串长度却很长,那么截取的子字符串包含原生字符串中的所有内容,并占据了相应的内存空间,而仅仅通过偏移量和长度来决定自己的实际取值。这种方式提高了运算速度却浪费了空间,是一种以时间换空间的解决方案。

  实例代码:

 public class Test {

     public static void main(String[] args) {
List<String> hander = new ArrayList<String>();
for (int i = 0; i < 100000; i++) {
HugeStr str = new HugeStr();
//ImpHugeStr str = new ImpHugeStr();
hander.add(str.getSubString(0, 5));
}
} } static class ImpHugeStr {
private String str = new String(new char[10000]);
public String getSubString(int begin,int end){//截取子字符串并且重新生成新的字符串
return new String(str.substring(begin, end));
}
}
static class HugeStr {
private String str = new String(new char[10000]);
public String getSubString(int begin,int end){//截取子字符串
return str.substring(begin, end);
}
}

  ImpHugeStr使用没有内存泄漏的String构造函数重新生成String对象,使得由subString()方法返回的,存在内存泄漏的String对象失去强引用,从而被垃圾回收机制当中垃圾回收,从而保证了系统内存的稳定。

  subString()之所以引起内存泄漏是因为使用了String(int offset,int count,char[] value)构造函数,此构造函数采用以空间换时间的策略。

  以上构造函数在java1.5中采用,在java1.6中采用以下构造函数:

 public String(char value[], int offset, int count) {
if (offset < 0) {
throw new StringIndexOutOfBoundsException(offset);
}
if (count < 0) {
throw new StringIndexOutOfBoundsException(count);
}
// Note: offset or count might be near -1>>>1.
if (offset > value.length - count) {
throw new StringIndexOutOfBoundsException(offset + count);
}
this.value = Arrays.copyOfRange(value, offset, offset+count);
}

  代码是采用this.value = Arrays.copyOfRange(value, offset, offset+count),使value失去强引用被垃圾回收,所有也不存在内存溢出的问题。

  • 字符串的分割和查找

  字符串的分割和查找也是字符串处理中最常用的方法之一,字符串分割是将原始字符串根据某一个分割符,切割成一组小的字符串。

  字符串的分割大致有三种方法:

  1、最原始的字符串分割:

  split()是最原始的字符串分割方法,但是它提供了非常强大的字符串分割功能。传入的参数可以是一个正则表达式,从而实现复杂逻辑的字符串分割。但是,对于简单字符串的风格,split()的性能却不尽如人意。所有在性能敏感的系统使用是不可取的。

  2、使用StringTokenizer类分割字符串:

  StringTokenizer是JDK提供的专门用于字符串分割子串的工具类。

  其构造函数:new StringTokenizer(String str,String delim),其中str参数为要处理的分割字符串,delim是分割符。当一个StringTokenizer对象生成后,可以通过nextToken()方法得到下一个要分隔的字符串,通过hasMoreTokens()方法可以知道是否有更多的子字符串需要处理。StringTokenizer的更多具体用法查看API。

  3、自己实现字符串分割方式:

  通过使用String对象的两个方法:indexOf()和subString()。前面提到subString()是通过以空间换时间的策略,它的执行速度很快,同时indexOf也是一个执行效率特别快的方式。

  实现代码:

 String str="";//待分割字符串
while(true){
String subStr = null;
int j = str.indexOf(";");//分割符
if(j<0) break;
subStr = str.subString(0,j);//截取子字符串
str = str.subString(j+1);//剩下待截取子串
}

  三种方式的比较,第一种split功能强大,但是效率最差;第二种StringTokenizer的效率由于split,因此可以使用StringTokenizer的地方一般尽量使用StringTokenizer;第三种执行效率最好,但是可读性比较差。

  另外,String对象还提供了一个charAt(int index)方法,它返回指定字符串中位于index的字符,它的功能和indexOf()相反,但是它的执行效率同样十分高。例如,经常在项目组遇到判断字符串以XX开头或XX结尾的问题,我们第一想到的是String对象提供的startWith()和endWith()方法,如果改用charAt()方法实现,效率会快很多。例如:"abcd".startWith("abc"),改为"abcd".charAt(1) == "a"&&"abcd".charAt(1) == "b"&&"abcd".charAt(1) == "c"在大量使用的场景下会提高系统效率。

  • StringBuffer和StringBuilder

  String对象是不可变对象,在需要对string对象进行修改操作时,string对象总是会生成新的对象,所有性能会比较差。因此,JDK就提供了专门用于创建和修改字符串的工具,就是StringBuffer和StringBuilder。

  1、String常量的累计操作:

  String对象具有不可变性,因此,一旦String对象实例生成,就不能再改变。如下代码:

 String str = "abc"+"de"+"f"+"gh";

  首先,"abc"和"de"两个字符串生成"abcde"对象,再依次生成"abcdef"和"abcdefgh"对象,理论上这样做的效率不会高。

  通过StringBuilder实现上诉功能:

 StringBuffer sb = new StringBuffer();
ab.append("abc");
ab.append("de");
ab.append("f");
ab.append("gh");

  对于静态字符串的连接操作,java在编译时会进行彻底的优化,将多个连接操作的字符串在编译时生成一个单独长的字符串,因此效率会高。

  2、String变量的累加操作:

  String对变量字符串的累加:

 String str1 = "abc";
String str2 = "de";
String str3 = "f";
String str4 = "gh";
String str = str1+str2+str3+str4;

  java编译时,会会对字符串处理进行一定的优化,对于变量字符串的累加,使用了StringBuilder对象来实现字符串的累加。但是在写代码的时候,建议显示的使用StringBuffer或StringBuilder进行优化。另外在java中类似于"+="或"+"的方法效率低于String对象的concat()方法,而concat()方法又远远低于StringBuilder类。因此,在项目中尽量使用StringBuilder来提升效率。

  3、StringBuffer和StringBuilder的选择

  StringBuffer对几乎所有方法都做了同步,而StringBuilder几乎没做任何同步,同步方法需要消耗一定的系统资源,因此StringBuilder的效率要好于StringBuffer。但是在多线程环境下,StringBuilder无法保证线程安全,因此在不考虑线程安全的情况下使用性能较好的StringBuilder,若系统有线程安全的要求则使用StringBuffer。

  另外,StringBuffer和StringBuilder都可以设置容量大小。

 void expandCapacity(int minimumCapacity) {
int newCapacity = value.length * 2 + 2;//扩大容量
if (newCapacity - minimumCapacity < 0)
newCapacity = minimumCapacity;
if (newCapacity < 0) {
if (minimumCapacity < 0) // overflow
throw new OutOfMemoryError();
newCapacity = Integer.MAX_VALUE;
}
value = Arrays.copyOf(value, newCapacity);//数组复制
}

  预先评估出容量的大小,能有效的减少数组扩容的操作,从而提升系统性能。

java中的字符串简介,字符串的优化以及如何高效率的使用字符串的更多相关文章

  1. 关于java中BigDecimal的简介

    关于java中BigDecimal的简介 1.BigDecimal属于大数据,精度极高,不属于基本数据类型,属于java对象(引用数据类型), 这是sun提供的一个类,专门用在财务软件中. 2.注意: ...

  2. Java中的异常简介

    Java中异常的分类 Java中的异常机制是针对正常运行程序的一个必要补充,一般来说没有加入异常机制,程序也能正常运营,但是,由于入参.程序逻辑的严谨度,总会有期望之外的结果生成,因此加入异常机制的补 ...

  3. 深入介绍Java中的锁[原理、锁优化、CAS、AQS]

    1.为什么要用锁? 锁-是为了解决并发操作引起的脏读.数据不一致的问题. 2.锁实现的基本原理 2.1.volatile Java编程语言允许线程访问共享变量, 为了确保共享变量能被准确和一致地更新, ...

  4. Java中的锁[原理、锁优化、CAS、AQS]

    1.为什么要用锁? 锁-是为了解决并发操作引起的脏读.数据不一致的问题. 2.锁实现的基本原理 2.1.volatile Java编程语言允许线程访问共享变量, 为了确保共享变量能被准确和一致地更新, ...

  5. Java中的锁原理、锁优化、CAS、AQS详解!

    阅读本文大概需要 2.8 分钟. 来源:jianshu.com/p/e674ee68fd3f 一.为什么要用锁? 锁-是为了解决并发操作引起的脏读.数据不一致的问题. 二.锁实现的基本原理 2.1.v ...

  6. Java 中的锁原理、锁优化、CAS、AQS 详解!(转)

    1.为什么要用锁? 锁-是为了解决并发操作引起的脏读.数据不一致的问题. 2.锁实现的基本原理 2.1.volatile Java编程语言允许线程访问共享变量, 为了确保共享变量能被准确和一致地更新, ...

  7. Java 中的锁原理、锁优化、CAS、AQS 详解!

    来源:jianshu.com/p/e674ee68fd3f 1.为什么要用锁? 锁-是为了解决并发操作引起的脏读.数据不一致的问题. 2.锁实现的基本原理 2.1.volatile Java编程语言允 ...

  8. Java 中一个过时的类,能够很好的统计单个字符串的次数

    //StringTokenizer st1=new StringTokenizer("rirtirtjdlkfjlksadfoiyetryetretrejtlkjdsflkiuetuiojr ...

  9. java中System类简介(转)

    上次面试中遇到的一个问题,问到System.out.println()中的out是不是内部类[不是内部类],当时就给问蒙了,直观感觉out应该是System类的一个属性,跟内部类有什么关系?而且之前整 ...

随机推荐

  1. Linux shell basic2 cat find tr

    Cat stands for concatenate. Case 1. When the text files have more blank lines, we want to remove the ...

  2. 我的vim配置文件.vimrc

    我的vim配置文件.vimrc map <silent> <F10> :TlistToggle<cr>map <silent> <F8> : ...

  3. Ubuntu 14.04 单机安装 CEPH

    0.如果先前安装过ceph,则先卸载 sudo stop ceph-all //停止所有CEPH进程 ceph-deploy uninstall [{ceph-node}] //卸载所有ceph程序 ...

  4. UESTC 31 饭卡(Card) --背包问题

    背包问题. 思路:如果m<5,此时也不能消费,所以此时答案为m m>=5: 求出背包容量为m-5,买前n-1样便宜的菜(排个序)的最大价值(即最大消费,即消费完后剩余值最接近5)最后减去最 ...

  5. 集合框架学习笔记<二>

    1.什么是ArrayList ArrayList就是传说中的动态数组,用MSDN中的说法,就是Array的复杂版本,它提供了如下一些好处: 动态的增加和减少元素 实现了ICollection和ILis ...

  6. Visio使用遇到的问题

    1.UML Background Add-on --------------------------- 此 UML 形状所在的绘图页不是 UML 模型图的一部分. 该形状设计用于利用 UML 模型图模 ...

  7. MongoDB学习(五)Linux环境安装MongoDB

    一.   下载 从http://www.mongodb.org/downloads地址中下载:mongodb-linux-x86_64-2.4.11.tar 二.  安装 1>设置mongoDB ...

  8. ASP代码审计一枚

    <% On Error Resume Next dim name, pass, sql, action set conn = server.CreateObject("ADODB.Co ...

  9. [6]Telerik TreeView 复选框

    参考连接:http://demos.telerik.com/aspnet-mvc/razor/treeview/clientsideapi 问题: Telerik TreeView 选择或取消 父选项 ...

  10. Mac 使用SSH远程登录

    一.打开ssh Mac Terminal是自带SSH的,可以用whereis来看看: $ whereis ssh 但是在现有进程中找不到ssh对应的进程: $ ps aux | grep ssh ap ...