Java编程的逻辑 (31) - 剖析Arrays
本系列文章经补充和完善,已修订整理成书《Java编程的逻辑》,由机械工业出版社华章分社出版,于2018年1月上市热销,读者好评如潮!各大网店和书店有售,欢迎购买,京东自营链接:http://item.jd.com/12299018.html
数组是存储多个同类型元素的基本数据结构,数组中的元素在内存连续存放,可以通过数组下标直接定位任意元素,相比我们在后续章节介绍的其他容器,效率非常高。
数组操作是计算机程序中的常见基本操作,Java中有一个类Arrays,包含一些对数组操作的静态方法,本节主要就来讨论这些方法,我们先来看怎么用,然后再来看它们的实现原理。学习Arrays的用法,我们就可以避免重新发明轮子,直接使用,学习它的实现原理,我们就可以在需要的时候,自己实现它不具备的功能。
用法
toString
Arrays的toString方法可以方便的输出一个数组的字符串形式,方便查看,它有九个重载的方法,包括八种基本类型数组和一个对象类型数组,这里列举两个:
- public static String toString(int[] a)
- public static String toString(Object[] a)
例如:
- int[] arr = {9,8,3,4};
- System.out.println(Arrays.toString(arr));
- String[] strArr = {"hello", "world"};
- System.out.println(Arrays.toString(strArr));
输出为
- [9, 8, 3, 4]
- [hello, world]
如果不使用Arrays.toString,直接输出数组自身,即代码改为:
- int[] arr = {9,8,3,4};
- System.out.println(arr);
- String[] strArr = {"hello", "world"};
- System.out.println(strArr);
则输出会变为如下所示:
- [I@1224b90
- [Ljava.lang.String;@728edb84
这个输出就难以阅读了,@后面的数字表示的是内存的地址。
数组排序 - 基本类型
排序是一个非常常见的操作,同toString一样,对每种基本类型的数组,Arrays都有sort方法(boolean除外),如:
- public static void sort(int[] a)
- public static void sort(double[] a)
排序按照从小到大升序排,看个例子:
- int[] arr = {4, 9, 3, 6, 10};
- Arrays.sort(arr);
- System.out.println(Arrays.toString(arr));
输出为:
- [3, 4, 6, 9, 10]
数组已经排好序了。
sort还可以接受两个参数,对指定范围内的元素进行排序,如:
- public static void sort(int[] a, int fromIndex, int toIndex)
包括fromIndex位置的元素,不包括toIndex位置的元素,如:
- int[] arr = {4, 9, 3, 6, 10};
- Arrays.sort(arr,0,3);
- System.out.println(Arrays.toString(arr));
输出为:
- [3, 4, 9, 6, 10]
只对前三个元素排序。
数组排序 - 对象类型
除了基本类型,sort还可以直接接受对象类型,但对象需要实现Comparable接口。
- public static void sort(Object[] a)
- public static void sort(Object[] a, int fromIndex, int toIndex)
我们看个String数组的例子:
- String[] arr = {"hello","world", "Break","abc"};
- Arrays.sort(arr);
- System.out.println(Arrays.toString(arr));
输出为:
- [Break, abc, hello, world]
"Break"之所以排在最前面,是因为大写字母比小写字母都小。那如果排序的时候希望忽略大小写呢?
数组排序 - 自定义比较器
sort还有另外两个重载方法,可以接受一个比较器作为参数:
- public static <T> void sort(T[] a, Comparator<? super T> c)
- public static <T> void sort(T[] a, int fromIndex, int toIndex,
- Comparator<? super T> c)
方法声明中的T表示泛型,泛型我们在后续章节再介绍,这里表示的是,这个方法可以支持所有对象类型,只要传递这个类型对应的比较器就可以了。Comparator就是比较器,它是一个接口,定义是:
- public interface Comparator<T> {
- int compare(T o1, T o2);
- boolean equals(Object obj);
- }
最主要的是compare这个方法,它比较两个对象,返回一个表示比较结果的值,-1表示o1小于o2,0表示相等,1表示o1大于o2。
排序是通过比较来实现的,sort方法在排序的过程中,需要对对象进行比较的时候,就调用比较器的compare方法。
String类有一个public静态成员,表示忽略大小写的比较器:
- public static final Comparator<String> CASE_INSENSITIVE_ORDER
- = new CaseInsensitiveComparator();
我们通过这个比较器再来对上面的String数组排序:
- String[] arr = {"hello","world", "Break","abc"};
- Arrays.sort(arr, String.CASE_INSENSITIVE_ORDER);
- System.out.println(Arrays.toString(arr));
这样,大小写就忽略了,输出变为了:
- [abc, Break, hello, world]
为进一步理解Comparator,我们来看下String的这个比较器的主要实现代码:
- private static class CaseInsensitiveComparator
- implements Comparator<String> {
- public int compare(String s1, String s2) {
- int n1 = s1.length();
- int n2 = s2.length();
- int min = Math.min(n1, n2);
- for (int i = 0; i < min; i++) {
- char c1 = s1.charAt(i);
- char c2 = s2.charAt(i);
- if (c1 != c2) {
- c1 = Character.toUpperCase(c1);
- c2 = Character.toUpperCase(c2);
- if (c1 != c2) {
- c1 = Character.toLowerCase(c1);
- c2 = Character.toLowerCase(c2);
- if (c1 != c2) {
- // No overflow because of numeric promotion
- return c1 - c2;
- }
- }
- }
- }
- return n1 - n2;
- }
- }
代码比较直接,就不解释了。
sort默认都是从小到大排序,如果希望按照从大到小排呢?对于对象类型,可以指定一个不同的Comparator,可以用匿名内部类来实现Comparator,比如可以这样:
- String[] arr = {"hello","world", "Break","abc"};
- Arrays.sort(arr, new Comparator<String>() {
- @Override
- public int compare(String o1, String o2) {
- return o2.compareToIgnoreCase(o1);
- }
- });
- System.out.println(Arrays.toString(arr));
程序输出为:
- [world, hello, Break, abc]
以上代码使用一个匿名内部类实现Comparator接口,返回o2与o1进行忽略大小写比较的结果,这样就能实现,忽略大小写,且按从大到小排序。为什么o2与o1比就逆序了呢?因为默认情况下,是o1与o2比。
Collections类中有两个静态方法,可以返回逆序的Comparator,如
- public static <T> Comparator<T> reverseOrder()
- public static <T> Comparator<T> reverseOrder(Comparator<T> cmp)
关于Collections类,我们在后续章节再详细介绍。
这样,上面字符串忽略大小写逆序排序的代码可以改为:
- String[] arr = {"hello","world", "Break","abc"};
- Arrays.sort(arr, Collections.reverseOrder(String.CASE_INSENSITIVE_ORDER));
- System.out.println(Arrays.toString(arr));
传递比较器Comparator给sort方法,体现了程序设计中一种重要的思维方式,将不变和变化相分离,排序的基本步骤和算法是不变的,但按什么排序是变化的,sort方法将不变的算法设计为主体逻辑,而将变化的排序方式设计为参数,允许调用者动态指定,这也是一种常见的设计模式,它有一个名字,叫策略模式,不同的排序方式就是不同的策略。
二分查找
Arrays包含很多与sort对应的查找方法,可以在已排序的数组中进行二分查找,所谓二分查找就是从中间开始找,如果小于中间元素,则在前半部分找,否则在后半部分找,每比较一次,要么找到,要么将查找范围缩小一半,所以查找效率非常高。
二分查找既可以针对基本类型数组,也可以针对对象数组,对对象数组,也可以传递Comparator,也都可以指定查找范围,如下所示:
针对int数组
- public static int binarySearch(int[] a, int key)
- public static int binarySearch(int[] a, int fromIndex, int toIndex,
- int key)
针对对象数组
- public static int binarySearch(Object[] a, Object key)
自定义比较器
- public static <T> int binarySearch(T[] a, T key, Comparator<? super T> c)
如果能找到,binarySearch返回找到的元素索引,比如说:
- int[] arr = {3,5,7,13,21};
- System.out.println(Arrays.binarySearch(arr, 13));
输出为3。如果没找到,返回一个负数,这个负数等于:-(插入点+1),插入点表示,如果在这个位置插入没找到的元素,可以保持原数组有序,比如说:
- int[] arr = {3,5,7,13,21};
- System.out.println(Arrays.binarySearch(arr, 11));
输出为-4,表示插入点为3,如果在3这个索引位置处插入11,可以保持数组有序,即数组会变为:{3,5,7,11,13,21}
需要注意的是,binarySearch针对的必须是已排序数组,如果指定了Comparator,需要和排序时指定的Comparator保持一致,另外,如果数组中有多个匹配的元素,则返回哪一个是不确定的。
数组拷贝
与toString一样,也有多种重载形式,如:
- public static long[] copyOf(long[] original, int newLength)
- public static <T> T[] copyOf(T[] original, int newLength)
后面那个是泛型用法,这里表示的是,这个方法可以支持所有对象类型,参数是什么数组类型,返回结果就是什么数组类型。
newLength表示新数组的长度,如果大于原数组,则后面的元素值设为默认值。回顾一下默认值,对于数值类型,值为0,对于boolean,值为false,对于char,值为'\0',对于对象,值为null。
来看个例子:
- String[] arr = {"hello", "world"};
- String[] newArr = Arrays.copyOf(arr, 3);
- System.out.println(Arrays.toString(newArr));
输出为:
- [hello, world, null]
除了copyOf方法,Arrays中还有copyOfRange方法,以支持拷贝指定范围的元素,如:
- public static int[] copyOfRange(int[] original, int from, int to)
from表示要拷贝的第一个元素的索引,新数组的长度为to-from,to可以大于原数组的长度,如果大于,与copyOf类似,多出的位置设为默认值。
来看个例子:
- int[] arr = {0,1,3,5,7,13,19};
- int[] subArr1 = Arrays.copyOfRange(arr,2,5);
- int[] subArr2 = Arrays.copyOfRange(arr,5,10);
- System.out.println(Arrays.toString(subArr1));
- System.out.println(Arrays.toString(subArr2));
输出为:
- [3, 5, 7]
- [13, 19, 0, 0, 0]
subArr1是正常的子数组,subArr2拷贝时to大于原数组长度,后面的值设为了0。
数组比较
支持基本类型和对象类型,如下所示:
- public static boolean equals(boolean[] a, boolean[] a2)
- public static boolean equals(double[] a, double[] a2)
- public static boolean equals(Object[] a, Object[] a2)
只有数组长度相同,且每个元素都相同,才返回true,否则返回false。对于对象,相同是指equals返回true。
填充值
Arrays包含很多fill方法,可以给数组中的每个元素设置一个相同的值:
- public static void fill(int[] a, int val)
也可以给数组中一个给定范围的每个元素设置一个相同的值:
- public static void fill(int[] a, int fromIndex, int toIndex, int val)
比如说:
- int[] arr = {3,5,7,13,21};
- Arrays.fill(arr,2,4,0);
- System.out.println(Arrays.toString(arr));
将索引从2(含2)到4(不含4)的元素设置为0,输出为:
- [3, 5, 0, 0, 21]
哈希值
针对数组,计算一个数组的哈希值:
- public static int hashCode(int a[])
计算hashCode的算法和String是类似的,我们看下代码:
- public static int hashCode(int a[]) {
- if (a == null)
- return 0;
- int result = 1;
- for (int element : a)
- result = 31 * result + element;
- return result;
- }
回顾一下,String计算hashCode的算法也是类似的,数组中的每个元素都影响hash值,位置不同,影响也不同,使用31一方面产生的哈希值更分散,另一方面计算效率也比较高。
多维数组
之前我们介绍的数组都是一维的,数组还可以是多维的,先来看二维数组,比如:
- int[][] arr = new int[2][3];
- for(int i=0;i<arr.length;i++){
- for(int j=0;j<arr[i].length;j++){
- arr[i][j] = i+j;
- }
- }
arr就是一个二维数组,第一维长度为2,第二维长度为3,类似于一个长方形矩阵,或者类似于一个表格,第一维表示行,第二维表示列。arr[i]表示第i行,它本身还是一个数组,arr[i][j]表示第i行中的第j个元素。
除了二维,数组还可以是三维、四维等,但一般而言,很少用到三维以上的数组,有几维,就有几个[],比如说,一个三维数组的声明为:
- int[][][] arr = new int[10][10][10];
在创建数组时,除了第一维的长度需要指定外,其他维的长度不需要指定,甚至,第一维中,每个元素的第二维的长度可以不一样,看个例子:
- int[][] arr = new int[2][];
- arr[0] = new int[3];
- arr[1] = new int[5];
arr是一个二维数组,第一维的长度为2,第一个元素的第二维长度为3,而第二个为5。
多维数组到底是什么呢?其实,可以认为,多维数组只是一个假象,只有一维数组,只是数组中的每个元素还可以是一个数组,这样就形成二维数组,如果其中每个元素还都是一个数组,那就是三维数组。
多维数组的操作
Arrays中的toString,equals,hashCode都有对应的针对多维数组的方法:
- public static String deepToString(Object[] a)
- public static boolean deepEquals(Object[] a1, Object[] a2)
- public static int deepHashCode(Object a[])
这些deepXXX方法,都会判断参数中的元素是否也为数组,如果是,会递归进行操作。
看个例子:
- int[][] arr = new int[][]{
- {0,1},
- {2,3,4},
- {5,6,7,8}
- };
- System.out.println(Arrays.deepToString(arr));
输出为:
- [[0, 1], [2, 3, 4], [5, 6, 7, 8]]
实现原理
hashCode的实现我们已经介绍了,fill和equals的实现都很简单,循环操作而已,就不赘述了。
toString
toString的实现也很简单,利用了StringBuilder,我们列下代码,但不做解释了。
- public static String toString(int[] a) {
- if (a == null)
- return "null";
- int iMax = a.length - 1;
- if (iMax == -1)
- return "[]";
- StringBuilder b = new StringBuilder();
- b.append('[');
- for (int i = 0; ; i++) {
- b.append(a[i]);
- if (i == iMax)
- return b.append(']').toString();
- b.append(", ");
- }
- }
拷贝
copyOf和copyOfRange利用了 System.arraycopy,逻辑也很简单,我们也只是简单列下代码:
- public static int[] copyOfRange(int[] original, int from, int to) {
- int newLength = to - from;
- if (newLength < 0)
- throw new IllegalArgumentException(from + " > " + to);
- int[] copy = new int[newLength];
- System.arraycopy(original, from, copy, 0,
- Math.min(original.length - from, newLength));
- return copy;
- }
二分查找
二分查找binarySearch的代码也比较直接,主要代码如下:
- private static <T> int binarySearch0(T[] a, int fromIndex, int toIndex,
- T key, Comparator<? super T> c) {
- int low = fromIndex;
- int high = toIndex - 1;
- while (low <= high) {
- int mid = (low + high) >>> 1;
- T midVal = a[mid];
- int cmp = c.compare(midVal, key);
- if (cmp < 0)
- low = mid + 1;
- else if (cmp > 0)
- high = mid - 1;
- else
- return mid; // key found
- }
- return -(low + 1); // key not found.
- }
有两个标志low和high,表示查找范围,在while循环中,与中间值进行对比,大于则在后半部分找(提高low),否则在前半部分找(降低high)。
排序
最后,我们来看排序方法sort,与前面这些简单直接的方法相比,sort要复杂的多,排序是计算机程序中一个非常重要的方面,几十年来,计算机科学家和工程师们对此进行了大量的研究,设计实现了各种各样的算法和实现,进行了大量的优化。一般而言,没有一个所谓最好的算法,不同算法往往有不同的适用场合。
那Arrays的sort是如何实现的呢?
对于基本类型的数组,Java采用的算法是双枢轴快速排序(Dual-Pivot Quicksort),这个算法是Java 1.7引入的,在此之前,Java采用的算法是普通的快速排序,双枢轴快速排序是对快速排序的优化,新算法的实现代码位于类java.util.DualPivotQuicksort中。
对于对象类型,Java采用的算法是TimSort, TimSort也是在Java 1.7引入的,在此之前,Java采用的是归并排序,TimSort实际上是对归并排序的一系列优化,TimSort的实现代码位于类java.util.TimSort中。
在这些排序算法中,如果数组长度比较小,它们还会采用效率更高的插入排序。
为什么基本类型和对象类型的算法不一样呢?排序算法有一个稳定性的概念,所谓稳定性就是对值相同的元素,如果排序前和排序后,算法可以保证它们的相对顺序不变,那算法就是稳定的,否则就是不稳定的。
快速排序更快,但不稳定,而归并排序是稳定的。对于基本类型,值相同就是完全相同,所以稳定不稳定没有关系。但对于对象类型,相同只是比较结果一样,它们还是不同的对象,其他实例变量也不见得一样,稳定不稳定可能就很有关系了,所以采用归并排序。
这些算法的实现是比较复杂的,所幸的是,Java给我们提供了很好的实现,绝大多数情况下,我们会用就可以了。
更多方法
其实,Arrays中包含的数组方法是比较少的,很多常用的操作没有,比如,Arrays的binarySearch只能针对已排序数组进行查找,那没有排序的数组怎么方便查找呢?
Apache有一个开源包(http://commons.apache.org/proper/commons-lang/),里面有一个类ArrayUtils (位于包org.apache.commons.lang3),里面实现了更多的常用数组操作,这里列举一些,与Arrays类似,每个操作都有很多重载方法,我们只列举一个。
翻转数组元素
- public static void reverse(final int[] array)
对于基本类型数组,Arrays的sort只能从小到大排,如果希望从大到小,可以在排序后,使用reverse进行翻转。
查找元素
- //从头往后找
- public static int indexOf(final int[] array, final int valueToFind)
- //从尾部往前找
- public static int lastIndexOf(final int[] array, final int valueToFind)
- //检查是否包含元素
- public static boolean contains(final int[] array, final int valueToFind)
删除元素
因为数组长度是固定的,删除是通过创建新数组,然后拷贝除删除元素外的其他元素来实现的。
- //删除指定位置的元素
- public static int[] remove(final int[] array, final int index)
- //删除多个指定位置的元素
- public static int[] removeAll(final int[] array, final int... indices)
- //删除值为element的元素,只删除第一个
- public static boolean[] removeElement(final boolean[] array, final boolean element)
添加元素
同删除一样,因为数组长度是固定的,添加是通过创建新数组,然后拷贝原数组内容和新元素来实现的。
- //添加一个元素
- public static int[] add(final int[] array, final int element)
- //在指定位置添加一个元素
- public static int[] add(final int[] array, final int index, final int element)
- //合并两个数组
- public static int[] addAll(final int[] array1, final int... array2)
判断数组是否是已排序的
- public static boolean isSorted(int[] array)
小结
本节我们分析了Arrays类,介绍了其用法,以及基本实现原理,同时,我们介绍了多维数组以及Apache中的ArrayUtils类。对于带Comparator参数的排序方法,我们提到,这是一种思维和设计模式,值得学习。
数组是计算机程序中的基本数据结构,Arrays类以及ArrayUtils类封装了关于数组的常见操作,使用这些方法吧!
下一节,我们来看计算机程序中,另一种常见的操作,就是对日期的操作。
----------------
未完待续,查看最新文章,敬请关注微信公众号“老马说编程”(扫描下方二维码),从入门到高级,深入浅出,老马和你一起探索Java编程及计算机技术的本质。用心写作,原创文章,保留所有版权。
Java编程的逻辑 (31) - 剖析Arrays的更多相关文章
- Java编程的逻辑 (48) - 剖析ArrayDeque
本系列文章经补充和完善,已修订整理成书<Java编程的逻辑>,由机械工业出版社华章分社出版,于2018年1月上市热销,读者好评如潮!各大网店和书店有售,欢迎购买,京东自营链接:http:/ ...
- Java编程的逻辑 (29) - 剖析String
本系列文章经补充和完善,已修订整理成书<Java编程的逻辑>,由机械工业出版社华章分社出版,于2018年1月上市热销,读者好评如潮!各大网店和书店有售,欢迎购买,京东自营链接:http: ...
- 计算机程序的思维逻辑 (31) - 剖析Arrays
数组是存储多个同类型元素的基本数据结构,数组中的元素在内存连续存放,可以通过数组下标直接定位任意元素,相比我们在后续章节介绍的其他容器,效率非常高. 数组操作是计算机程序中的常见基本操作,Java中有 ...
- Java编程的逻辑 (27) - 剖析包装类 (中)
本系列文章经补充和完善,已修订整理成书<Java编程的逻辑>,由机械工业出版社华章分社出版,于2018年1月上市热销,读者好评如潮!各大网店和书店有售,欢迎购买,京东自营链接:http: ...
- Java编程的逻辑 (28) - 剖析包装类 (下)
本系列文章经补充和完善,已修订整理成书<Java编程的逻辑>,由机械工业出版社华章分社出版,于2018年1月上市热销,读者好评如潮!各大网店和书店有售,欢迎购买,京东自营链接:http: ...
- Java编程的逻辑 (53) - 剖析Collections - 算法
本系列文章经补充和完善,已修订整理成书<Java编程的逻辑>,由机械工业出版社华章分社出版,于2018年1月上市热销,读者好评如潮!各大网店和书店有售,欢迎购买,京东自营链接:http:/ ...
- Java编程的逻辑 (30) - 剖析StringBuilder
本系列文章经补充和完善,已修订整理成书<Java编程的逻辑>,由机械工业出版社华章分社出版,于2018年1月上市热销,读者好评如潮!各大网店和书店有售,欢迎购买,京东自营链接:http: ...
- Java编程的逻辑 (51) - 剖析EnumSet
本系列文章经补充和完善,已修订整理成书<Java编程的逻辑>,由机械工业出版社华章分社出版,于2018年1月上市热销,读者好评如潮!各大网店和书店有售,欢迎购买,京东自营链接:http:/ ...
- Java编程的逻辑 (26) - 剖析包装类 (上)
本系列文章经补充和完善,已修订整理成书<Java编程的逻辑>,由机械工业出版社华章分社出版,于2018年1月上市热销,读者好评如潮!各大网店和书店有售,欢迎购买,京东自营链接:http:/ ...
随机推荐
- django -- model中只有Field类型的数据才能成为数据库中的列
一.model的定义: from django.db import models # Create your models here. class Person(models.Model): firs ...
- css冻结列的效果
<!DOCTYPE html><html lang="zh-cn"><head><meta charset="utf-8&quo ...
- [LeetCode] Paint House I & II
Paint House There are a row of n houses, each house can be painted with one of the three colors: red ...
- Android 消息分发机制
Android 中针对耗时的操作,放在主线程操作,轻者会造成 UI 卡顿,重则会直接无响应,造成 Force Close.同时在 Android 3.0 以后,禁止在主线程进行网络请求. 针对耗时或者 ...
- mysql SQLyog导入csv数据失败怎么办?
分享下mysql使用SQLyog导入csv数据失败的解决方法 给mysql导入数据,选中某个表选择导入--导入使用本地csv数据即可,单有的时候不知道什么问题导入不成功!!! 给mysql导入数据,使 ...
- android 去掉标题栏、状态栏、横屏
// 去掉标题栏 supportRequestWindowFeature(Window.FEATURE_NO_TITLE); // 全屏.隐藏状态栏 getWindow().setFlags(Wind ...
- angular控制器的执行顺序和服务的注入情况
这篇文章到底要讲什么呢? 这必须要从栗子开始讲起... 看下面这两段代码: demo1: http://jsfiddle.net/ujzmvp3j/1/ demo2: http://jsfiddle. ...
- quick3.3final版创建项目报错解决
PHP Notice: Undefined index: QUICK_V3_ROOT in 405,469,497,520,551这5行代码都访问了一个环境变量$_ENV['QUICK_V3_ROO ...
- Python2.7 fabric理论学习
在python中有一个可以实现批量管理服务器的工具:fabric,在本地和远程机器上提供了一些基本的操作,并且可以上传/下载文件.执行sudo等功能. 学习环境:ubuntu 12.10+python ...
- C# 实现list=list.OrderBy(q=>q.字段名).ToList(); 按多个字段排序
//倒序 list.OrderByDescending(i => i.a).ThenByDescending(i => i.b); //顺序 list.OrderBy(i => i. ...