在开发中,我们都会频繁的使用String类,掌握String的实现和常用方法是必不可少的,当然,我们还需要了解它的内部实现。

一. String的实现

在Java中,采用了一个char数组实现String类型,这个char数组被定义为final类型,这就意味着一旦一个String被创建,那么它就是不可变的。除此之外,还定义了一个int类型的hash,用来保存该String的hash值。

 /** The value is used for character storage. */
private final char value[]; /** Cache the hash code for the string */
private int hash; // Default to 0

二. String中的构造器

创建String的方法很多,构造器也有多个。但是其目的就是给value数组赋值。构造器中传入的参数大致可以分为几个部分:

src:来源,就是希望在value中保存的字符串,传入的值可以是String,char数组,int数组,byte数组,Stringbuffer,StringBuilder,boolean值。

offset:src中字符串的起始位置。

count:src中赋值到value中的字符串的个数。

Charset:指定字符集。

当然,不是每一个构造器都需要这些参数,我们也不需要一个个都详细掌握,只要知道大概存在哪些构造方法即可,要用的时候可以查询API。

三. String中常用的方法以及实现

1. 获取字符数组

获取字符数组方法:

     public void getChars(int srcBegin, int srcEnd, char dst[], int dstBegin)

该方法将String中指定位置的字符复制个dst,具体的实现如下:

 public void getChars(int srcBegin, int srcEnd, char dst[], int dstBegin) {
    //对指定位置进行判断
if (srcBegin < 0) {
throw new StringIndexOutOfBoundsException(srcBegin);
}
if (srcEnd > value.length) {
throw new StringIndexOutOfBoundsException(srcEnd);
}
if (srcBegin > srcEnd) {
throw new StringIndexOutOfBoundsException(srcEnd - srcBegin);
}
    //调用native方法进行数组复制
System.arraycopy(value, srcBegin, dst, dstBegin, srcEnd - srcBegin);
}

2. equals()、equalsIgnoreCase()、regionMatches()、compareTo()、compareToIgnoreCase()、hashCode()

equals()方法用来判断两个String是否相等,实现逻辑如下:

 public boolean equals(Object anObject) {
if (this == anObject) {//如果两个String是引用同一个String对象,则相等
return true;
}
if (anObject instanceof String) {//否则,在长度相等的前提下,从第一个字符开始进行比较
String anotherString = (String)anObject;
int n = value.length;
if (n == anotherString.value.length) {
char v1[] = value;
char v2[] = anotherString.value;
int i = 0;
while (n-- != 0) {
if (v1[i] != v2[i])
return false;
i++;
}
return true;
}
}
return false;
}

equalsIgnoreCase()忽略大小写进行判断,其内部实现是调用regionMatches()方法。

  regionMatches()方法是用来判断两个字符串区域是否相等。String中有两个regionMatches()方法,不同之处在于有一个增加一个boolean值决定是否忽略大小写进行判断。具体的实现如下:

 public boolean regionMatches(boolean ignoreCase, int toffset,
String other, int ooffset, int len) {
char ta[] = value;
int to = toffset;
char pa[] = other.value;
int po = ooffset;
if ((ooffset < 0) || (toffset < 0)
|| (toffset > (long)value.length - len)
|| (ooffset > (long)other.value.length - len)) {
return false;//不满足以上条件的都返回false
}
while (len-- > 0) {
char c1 = ta[to++];
char c2 = pa[po++];
if (c1 == c2) {
continue;
}
if (ignoreCase) {//是否区分大小写。
char u1 = Character.toUpperCase(c1);
char u2 = Character.toUpperCase(c2);
if (u1 == u2) {
continue;
}
if (Character.toLowerCase(u1) == Character.toLowerCase(u2)) {
continue;
}
}
return false;
}
return true;
}

  另外还存在一个判断两个字符串区是否相等的方法,但是是区分大小写的: public boolean regionMatches(int toffset, String other, int ooffset, int len),但是这个方法内部实现没有复用上面这个方法。

  compareTo()方法是用来比较两个字符串大小,比较规则为:按字典顺序比较两个字符串。该比较基于字符串中各个字符的 Unicode 值。将此 String 对象表示的字符序列与参数字符串所表示的字符序列进行比较。如果按字典顺序此 String 对象在参数字符串之前,则比较结果为一个负整数。如果按字典顺序此 String 对象位于参数字符串之后,则比较结果为一个正整数。如果这两个字符串相等,则结果为 0。具体实现如下:  

 public int compareTo(String anotherString) {
int len1 = value.length;
int len2 = anotherString.value.length;
int lim = Math.min(len1, len2);
char v1[] = value;
char v2[] = anotherString.value; int k = 0;
while (k < lim) {
char c1 = v1[k];
char c2 = v2[k];
if (c1 != c2) {
return c1 - c2;//字符不等,返回Unicode差值。
}
k++;
}
return len1 - len2;//两个字符串长度,返回长度差值。若为0,表示两字符串大小相等。
}

  compareToIgnoreCase()方法实现:String在内部自定义了一个名为CaseInsensitiveComparator的类,实现Comparator,用来比较忽略大小写的两个字符串,比较逻辑是,依次取出两个字符进行忽略大小写的比较,其余逻辑和上面类似。

  hashCode()方法返回String的hash值。

3. startWith()、endWith()

startsWith(String prefix)是判断字符串是不是以某个指定的子字符串开始,返回boolean值。

startsWith(String prefix, int toffset)是判断字符串从指定的位置开始是否是以指定的字符串开始,返回boolean值。其实现逻辑是取出对于位置的两个字符,进行判断。

endsWith(String suffix)是判断字符串是不是以某个字符串结尾。它的实现逻辑是调用startsWith(String prefix, int toffset)方法,具体实现如下:

 public boolean endsWith(String suffix) {
return startsWith(suffix, value.length - suffix.value.length);
}

4. indexOf()、lastIndexOf()

indexOf(int ch):返回指定字符在此字符串中第一次出现处的索引。

indexOf(int ch, int fromIndex):从指定的索引开始搜索,返回在此字符串中第一次出现指定字符处的索引。

lastIndexOf(int ch):返回最后一次出现的指定字符在此字符串中的索引。

lastIndexOf(int ch, int fromIndex):从指定的索引开始搜索,返回在此字符串中最后一次出现指定字符处的索引。

indexOf(String str):返回第一次出现的指定子字符串在此字符串中的索引。

indexOf(String str, int fromIndex):从指定的索引处开始,返回第一次出现的指定子字符串在此字符串中的索引。

lastIndexOf(String str):返回在此字符串中最右边出现的指定子字符串的索引。

lastIndexOf(String str, int fromIndex):从指定的索引处开始向后搜索,返回在此字符串中最后一次出现的指定子字符串的索引。

以上方法如果没有找到索引,则返回-1.

5. substring()、concat()、matches()、contains()

substring(int beginIndex):返回一个新的字符串,它是此字符串的一个子字符串。该子字符串始于指定索引处的字符,一直到此字符串末尾。

substring(int beginIndex, int endIndex):返回一个新字符串,它是此字符串的一个子字符串。该子字符串从指定的 beginIndex 处开始,一直到索引 endIndex - 1 处的字符。

concat(String str):将指定字符串联到此字符串的结尾。

matches(String regex):判断此字符串是否匹配给定的正则表达式。

contains(CharSequence s):判断字符串中是否有该字符序列。

6. replace()、replaceFirst()、replaceAll()

replace(char oldChar, char newChar):返回一个新的字符串,用 newChar 替换此字符串中出现的所有 oldChar 。具体实现如下:  

public String replace(char oldChar, char newChar) {
if (oldChar != newChar) {
int len = value.length;
int i = -1;
char[] val = value; /* avoid getfield opcode */ while (++i < len) {
if (val[i] == oldChar) {
break;
}
}
if (i < len) {
char buf[] = new char[len];
for (int j = 0; j < i; j++) {
buf[j] = val[j];
}
while (i < len) {
char c = val[i];
buf[i] = (c == oldChar) ? newChar : c;
i++;
}
return new String(buf, true);
}
}
return this;
}

replaceFirst(String regex, String replacement):使用给定的 replacement 字符串替换此字符串匹配给定的正则表达式的第一个子字符串。

replaceAll(String regex, String replacement):使用给定的 replacement 字符串替换此字符串匹配给定的正则表达式的每个子字符串。

7. split()、join()

  String[] split(String regex, int limit):根据匹配给定的正则表达式来拆分此字符串。数控制模式应用的次数,因此影响结果数组的长度。如果该限制 n 大于 0,则模式将被最多应用 n - 1 次,数组的长度将不会大于 n,而且数组的最后项将包含超出最后匹配的定界符的所有输入。如果 n 为非正,则模式将被应用尽可能多的次数,而且数组可以是任意长度。如果 n 为零,则模式将被应用尽可能多的次数,数组可有任何长度,并且结尾空字符串将被丢弃。

  String[] split(String regex):根据给定的正则表达式的匹配来拆分此字符串。该方法的作用就像是使用给定的表达式和限制参数 0 来调用两参数 split 方法。

 public String[] split(String regex, int limit) {
/* fastpath if the regex is a
(1)one-char String and this character is not one of the
RegEx's meta characters ".$|()[{^?*+\\", or
(2)two-char String and the first char is the backslash and
the second is not the ascii digit or ascii letter.
*/
char ch = 0;
if (((regex.value.length == 1 &&
".$|()[{^?*+\\".indexOf(ch = regex.charAt(0)) == -1) ||
(regex.length() == 2 &&
regex.charAt(0) == '\\' &&
(((ch = regex.charAt(1))-'0')|('9'-ch)) < 0 &&
((ch-'a')|('z'-ch)) < 0 &&
((ch-'A')|('Z'-ch)) < 0)) &&
(ch < Character.MIN_HIGH_SURROGATE ||
ch > Character.MAX_LOW_SURROGATE))
{
int off = 0;
int next = 0;
boolean limited = limit > 0;
ArrayList<String> list = new ArrayList<>();
while ((next = indexOf(ch, off)) != -1) {
if (!limited || list.size() < limit - 1) {
list.add(substring(off, next));
off = next + 1;
} else { // last one
//assert (list.size() == limit - 1);
list.add(substring(off, value.length));
off = value.length;
break;
}
}
// If no match was found, return this
if (off == 0)
return new String[]{this}; // Add remaining segment
if (!limited || list.size() < limit)
list.add(substring(off, value.length)); // Construct result
int resultSize = list.size();
if (limit == 0) {
while (resultSize > 0 && list.get(resultSize - 1).length() == 0) {
resultSize--;
}
}
String[] result = new String[resultSize];
return list.subList(0, resultSize).toArray(result);
}
return Pattern.compile(regex).split(this, limit);
}

  String join(CharSequence delimiter, CharSequence... elements):

  String join(CharSequence delimiter, Iterable<? extends CharSequence> elements):这两个方法是jdk1.8中出现的,类似字符串拼接,不过可以指定连接符delimiter,后面的elements中间使用该连接符连接。具体实现如下:

 public static String join(CharSequence delimiter, CharSequence... elements) {
Objects.requireNonNull(delimiter);
Objects.requireNonNull(elements);
// Number of elements not likely worth Arrays.stream overhead.
StringJoiner joiner = new StringJoiner(delimiter);
for (CharSequence cs: elements) {
joiner.add(cs);//该方法中会将连接符拼接
}
return joiner.toString();
}

8. 字符串大小写转换:

toLowerCase():转换为小写

toUpperCase():转换为大写

9. 其他方法:

trim():去掉字符串收尾的空白。

toCharArray():将此字符串转换为一个新的字符数组。

valueOf():返回 某参数的字符串表示形式。就是将其他类型转换为String类型的一种方式。

intern():当调用 intern 方法时,如果池已经包含一个等于此 String 对象的字符串,则返回池中的字符串。否则,将此 String 对象添加到池中,并且返回此 String 对象的引用。

String详解的更多相关文章

  1. Java的String详解

    Java的String详解 博客分类: Java javaStringString详解常用方法  Java的String类在开发时经常都会被使用到,由此可见String的重要性.经过这次认真仔细的学习 ...

  2. Python操作redis字符串(String)详解 (三)

    # -*- coding: utf-8 -*- import redis #这个redis不能用,请根据自己的需要修改 r =redis.Redis(host=") 1.SET 命令用于设置 ...

  3. [读书笔记]C#学习笔记八:StringBuilder与String详解及参数传递问题剖析

    前言 上次在公司开会时有同事分享windebug的知识, 拿的是string字符串Concat拼接 然后用while(true){}死循环的Demo来讲解.其中有提及string操作大量字符串效率低下 ...

  4. String详解, String和CharSequence区别, StringBuilder和StringBuffer的区别 (String系列之1)

    本章主要介绍String和CharSequence的区别,以及它们的API详细使用方法. 转载请注明出处:http://www.cnblogs.com/skywang12345/p/string01. ...

  5. Java堆、栈和常量池以及相关String详解

    一:在JAVA中,有六个不同的地方可以存储数据: 1. 寄存器(register). 这是最快的存储区,因为它位于不同于其他存储区的地方——处理器内部.但是寄存器的数量极其有限,所以寄存器由编译器根据 ...

  6. String详解, String和CharSequence区别, StringBuilder和StringBuffer的区别

    本章主要介绍String和CharSequence的区别,以及它们的API详细使用方法. 转载请注明出处:http://www.cnblogs.com/skywang12345/p/string01. ...

  7. String 详解

    String String对象不可变,当对象创建完毕之后,如果内容改变则会创建一个新的String对象,返回到原地址中. 不可变优点: 多线程安全. 节省空间,提高效率. 源码: public fin ...

  8. java String 详解

    1.java语言的字符串序列是通过字符串类实现的.java提供了3个字符串类:String类.StringBuilder类和StringBuffer类.String类是不变字符串,StringBuff ...

  9. C#String详解

    字符串:stringLength - 字符串的长度. TrimStart() 压缩空格即消除字符串开始空格TrimEnd() 消除结尾空格Trim() 同时消除开头和结尾空格.注:中间空格不消除,因为 ...

随机推荐

  1. Android volley 当用fiddler2 抓包时隔一段时间不操作,会出现 http 408错误

    出现原因是由于fiddler2导致,关闭fiddler2即可...

  2. .net之微信企业号开发(二) 企业号人员身份认证与开发

    前言 这里完全可以链接一个登录页面,让用户输入用户名密码进行登录的...2333 但是,这样所就完全失去了微信企业号的意义,本来进入微信企业号的时候,就已经对人员身份进行认证了,你这里再让别人登录,不 ...

  3. .net framework 版本汇总

    Version Release Date 1.0.3705.0 1RTM 2002/2/13 1.0.3705.209 1SP1 2002/3/19 1.0.3705.288 1SP2 2002/8/ ...

  4. Sql server中访问Excel---select from Excel

    本文介绍在MSSMS中通过SQL语句查询Excel的方法. 访问Excel主要是通过Office提供的ACE数据源来完成这个操作,使用opendatasource来实现访问Excel.即在MSSMS中 ...

  5. 第五章GPIO接口

    5.1 GPIO硬件介绍 可以不通过他们输出高低电平或者通过它们读入应交的状态 S3C2410有117个I/O端口,分为A~H共8组:GPA.GPB....GPH S3C2440有130个I/O端口, ...

  6. Fragment、Activity 保存状态

    Activity 保存状态1. void onCreate(Bundle savedInstanceState) 当Activity被第首次加载时执行.我们新启动一个程序的时候其主窗体的onCreat ...

  7. 微信内置浏览器的JS API

    /**! * 微信内置浏览器的Javascript API,功能包括: * * 1.分享到微信朋友圈 * 2.分享给微信好友 * 3.分享到腾讯微博 * 4.新的分享接口,包含朋友圈.好友.微博的分享 ...

  8. 升级ruby后再安装cocodPod

    1.移除现有的Ruby $gem sources --remove https://rubygems.org/ 2.使用淘宝镜像 $gem sources -a https://ruby.taobao ...

  9. SqlServerProxy的一些资料

    SqlServerProxy的一些资料 下载地址:http://files.cnblogs.com/files/lyhabc/SqlServerProxy.rar 1.特性及实现原理 SqlServe ...

  10. Angular 2 + Electron 开发web和桌面应用

    https://github.com/zhongzf/angular2-electron-quickstart Web用法: # Clone this repository git clone htt ...