本文源码均来自Java 8

总体介绍

Collection接口是集合类的根接口,Java中没有提供这个接口的直接的实现类。Set和List两个类继承于它。Set中不能包含重复的元素,也没有顺序来存放。而List是一个有序的集合,可以包含重复的元素。

而Map又是另一个接口,它和Collection接口没有关系。Map包含了key-value键值对,同一个Map里key是不能重复的,而不同key的value是可以相同的。

在这里借用一张别人总结的对比图进行总结

 
集合类对比

(上图来源:http://www.cnblogs.com/leeplogs/p/5891861.html)
具体的各个类的实现子类在这就不在具体介绍,网上已经有很多介绍的文章,就不在这里再展开介绍。今天我们来专门看看ArrayList的源码。


成员变量

首先我们来看看ArrayList的成员变量:

  /**
* Default initial capacity.
*/
private static final int DEFAULT_CAPACITY = 10; /**
* Shared empty array instance used for empty instances.
*/
private static final Object[] EMPTY_ELEMENTDATA = {}; /**
* The array buffer into which the elements of the ArrayList are stored.
* The capacity of the ArrayList is the length of this array buffer. Any
* empty ArrayList with elementData == EMPTY_ELEMENTDATA will be expanded to
* DEFAULT_CAPACITY when the first element is added.
*
* Package private to allow access from java.util.Collections.
*/
transient Object[] elementData; /**
* The size of the ArrayList (the number of elements it contains).
*
* @serial
*/
private int size;

可以看到主要的几个成员变量如上(跟进继承的父类,父父类直到根父类都没有成员变量)。我们来一一介绍一下。首先是一个常量DEFAULT_CAPACITY,根据注释表示默认的长度为10。然后是一个EMPTY_ELEMENTDATA的常量object数组,只是空有其表没有内容。然后是一个object数组elementData。这个就是最重要的成员了,通过注释我们可以看到这表示这个数组用来存储我们的数据。也就是说,我们代码中的add的数据都会放在这个数组里面。那么由此我们可知,ArrayList内部是由数组实现。再看最后一个变量,int类型的size。第一眼还以为是elementData数组的长度。仔细看注释,才发现它表示的是elementData数组里面包含的数据长度。

构造函数

介绍完了成员变量,我们来看看构造方法:

 public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException("Illegal Capacity: "+
initialCapacity);
}
} public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
} public ArrayList(Collection<? extends E> c) {
elementData = c.toArray();
if ((size = elementData.length) != 0) {
// c.toArray might (incorrectly) not return Object[] (see 6260652)
if (elementData.getClass() != Object[].class)
elementData = Arrays.copyOf(elementData, size, Object[].class);
} else {
// replace with empty array.
this.elementData = EMPTY_ELEMENTDATA;
}
}

我们看到主要有三个构造方法。

第一个构造方法需要传入一个int类型的变量。表示我们实例化一个ArrayList的时候想让ArrayList的初始化长度为多少。然后如果该变量大于0,那么new一个长度为传入值的对象数组。如果传入为0,那么等于EMPTY_ELEMENTDATA。这个变量我们上面讲过,就是实例化一个对象数组,内容为空。如果小于0,那么抛出异常。

第二个构造方法是无参构造方法,直接等于DEFAULTCAPACITY_EMPTY_ELEMENTDATA。没有其他的好说的。

第三个则我们另外一种常见的使用方法,比如处理化AList的时候想把BList的值传给AList。那么使用如下代码:

List<Integer> AList = new ArrayList<>(BList);

我们看看构造函数做了什么。我们看到首先调用了c.toArray()方法将我们传入的集合元素变成一个数组来赋值给elementData数组。然后判断elementData数组里面是否有数据元素,如果有,那么再判断elementData数组类型是否为Object[],不是的话,转为Object[]类型。如果没有元素,那么直接赋值为EMPTY_ELEMENTDATA。

至此三个构造方法就已经分析完了,基本上没有什么难度。


常见方法

接下来我们来分析一些ArrayList的常见方法。

size()

 public int size() {
return size;
}

很简单,就是将elementData数组中元素个数返回。

isEmpty()

 public boolean isEmpty() {
return size == 0;
}

也很简单,就是判断sizes是否等于0,即elementData数组中是否有元素。

add()

我们先来看add(E e) 方法:

 public boolean add(E e) {
ensureCapacityInternal(size + 1); // Increments modCount!!
elementData[size++] = e;
return true;
}

可以看到add()方法还是比较简短的,接下面我们一步一步的分析,第一行是调用了一个方法,第二行是常见的数组赋值,将下标为size处的数组元素赋值为e,然后size自加1。如果有意识的话,会想到,咦?这么做的话,不怕数组越界??那么我们去第一行代码的方法里看看:

 private void ensureCapacityInternal(int minCapacity) {
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
} ensureExplicitCapacity(minCapacity);
}

首先第一个方法中先判断elementData是否是没有元素的数组(但并不是elemetData为null)。如果是,那么取我们传入的值(也就是size + 1)和默认的数组长度(长度为10)中的最大值。然后调用了ensureExplicitCapacity()方法。我们继续看这个方法:

private void ensureExplicitCapacity(int minCapacity) {
modCount++; // overflow-conscious code
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}

首先是一个int类型的成员变量modCount自加,这个变量是ArrayList的父类AbstractList的一个成员,用来表示List的修改次数。接下来有一个判断,用传入的值减去当前elementData的长度,如果大于0,调用grow()方法(我个人理解为扩展的意思),这里其实也能猜出大概意思。如果我们所需的最小数组长度已经比当前数组长度大了,那么就需要我们扩展数组了。我们接着看grow()方法:

private void ensureExplicitCapacity(int minCapacity) {
modCount++; // overflow-conscious code
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}

我们接着看代码,首先保存当前数组长度到oldCapacity,然后定义一个newCapacity,新长度为旧长度的3/2,也就是增加一半的容量。然后用新长度减去所需最小长度,如果小于0,意味着新长度比所需长度还要小,那么就直接将新长度改为所需最小长度。然后新长度如果超过了允许的数组最大长度,调用hugeCapacity()方法进行调整。最后处理完毕后,调用Arrays.copyOf()方法赋值给elementData。至此就把elementData数组扩展完毕。然后回到add方法中直接赋值 elementData[size++] = e即可。
我们来看第二个add()方法:

public void add(int index, E element) {
        if (index > size || index < 0)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index)); ensureCapacityInternal(size + 1); // Increments modCount!!
System.arraycopy(elementData, index, elementData, index + 1,
size - index);
elementData[index] = element;
size++;
}

上面的方法也是我们常用的,将指定的下标处元素赋值为我们设定的值。最开始我用这个方法的时候一直很担心假设我把指定位置设置了值,那原来的值会不会被覆盖呢?

我们看一下实现代码解惑一下,也很简单。首先检查index索引是否比elementData中拥有元素的数量大或者小于0。有问题则抛出异常。负责又调用ensureCapacityInternal()方法来确认数组长度是否足够。然后调用System.arraycopy()方法,我们来看看:

public static native void arraycopy(Object src,  int  srcPos,
Object dest, int destPos,
int length);

可以看到是个native方法,我们就不跟源码了,看看参数含义就明白了。src就是源数组,srcPos就是表明从源数组的下标多少开始复制,dest和destPos就是对应的目的数组,复制源数组的数据到从目的数组的下标开始存放,length就是打算复制多少个源数组的值。说了半天有点绕口,看看上面的调用例子,我们用具体例子来讲解。首先源数组是elementData,假设有6个元素(即size为6,但是elementData的长度大于6),index假设为3,length为size - index为3。而dest也为elementData,destPos为index + 1 等于4。所以整体就是从index(3)下标处即elementData[3]处开始往后拿3个值,复制到elementDatadestPos开始往后3个值。

其实解释了半天就是将我们要插入的位置开始的元素全部往后移了一个位置。然后把值插入到指定的位置。(我真聪明)所以之前的担心就多余啦。我们插入到指定位置,指定位置的旧值会往后移,并不会被覆盖。

clear

public void clear() {
modCount++; // clear to let GC do its work
for (int i = 0; i < size; i++)
elementData[i] = null; size = 0;
}

clear()方法也很简单,首先modCount自加,表示我们对list进行了操作。然后for循环置空即可,最后设置size等于0。

remove()

remove()也有两个方法,我们来看第一个:

 public E remove(int index) {
if (index >= size)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index)); modCount++;
E oldValue = (E) elementData[index]; int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
elementData[--size] = null; // clear to let GC do its work return oldValue;
}

根据传入参数我们也能猜到意思,就是移除指定下标的元素。
首先还是检查index是否有效。然后modCount++,表示我们对list又进行一次操作。然后将指定下标的元素取出。然后计算出我们需要移动多少个元素,指的是从删除位置往后的元素,不包括删除位置的元素。如果个数大于0,那么调用 System.arraycopy()方法将删除位置后的一个元素开始到最后的元素往前移动一个位置。然后将size立马自减,然后将最后一个位置置为null(因为元素往前移动一位,那么最后一个元素往前移后,原来的最后一个位置值还存在没有被覆盖)。
最后返回旧的删除位置的元素值。

接下来我们来看第二个remove()方法:

public boolean remove(Object o) {
if (o == null) {
for (int index = 0; index < size; index++)
if (elementData[index] == null) {
fastRemove(index);
return true;
}
} else {
for (int index = 0; index < size; index++)
if (o.equals(elementData[index])) {
fastRemove(index);
return true;
}
}
return false;
}

很明显看参数也猜得出是直接移除掉我们某个元素。首先判断我们传入的object是否为空,如果为空,那么就for循环找到第一个数组中值为null的元素,调用fastRemove()方法,我们去看看:

 /*
* Private remove method that skips bounds checking and does not
* return the value removed.
*/
private void fastRemove(int index) {
modCount++;
int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
elementData[--size] = null; // clear to let GC do its work
}

从注释看出,其实这就是第一个remove()方法的简化版,取消了越界检查,并且设置返回类型为void,不再返回删除的旧值。这里就不再分析。

接着上面说,如果remove()中如果传入的对象不为null,那么就是for循环找到这个值然后移除即可。整个函数返回类型为boolean,true表示有这个对象删除成功。没有表示数组里没有这个对象,没有进行删除操作。

contains()

public boolean contains(Object o) {
return indexOf(o) >= 0;
}

contains()也是我们经常使用的方法,用来查询当前ArrayList是否包含某个对象。我们看调用了一个indexOf()方法然后把返回值和0进行比较(乍一看还是很奇怪的,返回布尔值不好吗),我们来看看indexOf()方法:

public int indexOf(Object o) {
if (o == null) {
for (int i = 0; i < size; i++)
if (elementData[i]==null)
return i;
} else {
for (int i = 0; i < size; i++)
if (o.equals(elementData[i]))
return i;
}
return -1;
}

我们来看看代码,首先是对传入对象的判空。如果对象为空,还是一样的,for循环来查找elementData中第一个为null的元素,然后返回下标。如果传入对象不为空,那么一样for循环查找第一个匹配元素,然后返回第一个匹配元素的下标。如果都找不到,那么就返回-1。

看完这个方法,就明白了为啥不用返回值布尔类型了,原来是返回下标来和0进行判断是否包含。但是我们可以看到其实contains()方法并没有返回元素下标。所以本人第一次看完代码觉得这是多此一举。后来突然想到indexOf()方法是一个public方法,也是我们经常使用的方法。可能就在这里java编写者进行方法重用就不必再重复写新方法来判断。顺带着我们就把indexOf()方法介绍,方法就是返回第一个匹配传入对象的元素下标。如果数组中没有匹配元素那么返回-1。

get()

public E get(int index) {
rangeCheck(index); return elementData(index);
} private void rangeCheck(int index) {
if (index >= size)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
} E elementData(int index) {
return (E) elementData[index];
}

这个方法可以说是最最常用的方法了,但是其实我们看到非常简单,就是进行一个下标的越界判断,然后返回elementData[index]元素。

set()

public E set(int index, E element) {
rangeCheck(index); E oldValue = elementData(index);
elementData[index] = element;
return oldValue;
}

set方法也是,其实set(int index, E element)和add(int index, E element)方法很相似。只是set是将指定位置的值直接覆盖掉,而add()则是将指定位置开始的元素往后全部后移一位,旧值不会被覆盖掉。set()方法没有什么可以多分析的代码。

至此我们常见的ArrayList的方法源码分析就已经完了,其他的一些方法要么不怎么用,要么非常简单只有一两行简单代码,读者一跟进去就能明白。


最后我们再来总结一下:

  • 首先ArrayList内部是由数组来实现的。而且在存放数据的数组长度不够时,会进行扩容,即增加数组长度。在Java 8中是默认扩展为原来的1.5倍。
  • 既然是数组,那么优点就是查找某个元素很快。可以通过下标查找元素,查找效率高。但是由此也看出缺点,每次删除元素,都会进行大量的数组元素移动,复制新的数组等等。增加元素的话如果长度不够,还要进行扩容。因此删除效率低。如果我们在实际开发中能够清楚知道我们的数据量,建议创建ArrayList的时候指定长度,这样无需频繁增加数据时不断进行扩容。

参考链接:https://www.jianshu.com/p/d49e4f5dc4c1

Java源码之ArrayList的更多相关文章

  1. 浅析Java源码之ArrayList

    面试题经常会问到LinkedList与ArrayList的区别,与其背网上的废话,不如直接撸源码! 文章源码来源于JRE1.8,java.util.ArrayList 既然是浅析,就主要针对该数据结构 ...

  2. Java源码阅读ArrayList

    1简介 public class ArrayList<E> extends AbstractList<E> implements List<E>, RandomAc ...

  3. Java源码之ArrayList分析

    一.ArrayList简介 ArrayList底层的数据结构是数组,数组元素类型为Object类型,即可以存放所有类型数据. 与Java中的数组相比,它的容量能动态增长.当创建一个数组的时候,就必须确 ...

  4. Java源码-集合-ArrayList

    基于JDK1.8.0_191 介绍   在Java中,对于数据的保存和使用有多种方式,主要的目的是以更少的资源消耗解决更多的问题,数组就是其中的一种,它的特点是所有的数据都保存在内存的一段连续空间中, ...

  5. Java源码解析——集合框架(一)——ArrayList

    ArrayList源码分析 ArrayList就是动态数组,是Array的复杂版本,它提供了动态的增加和减少元素.灵活的设置数组的大小. 一.类声明 public class ArrayList< ...

  6. Java源码系列1——ArrayList

    本文简单介绍了 ArrayList,并对扩容,添加,删除操作的源代码做分析.能力有限,欢迎指正. ArrayList是什么? ArrayList 就是数组列表,主要用来装载数据.底层实现是数组 Obj ...

  7. Java集合源码剖析——ArrayList源码剖析

    ArrayList简介 ArrayList是基于数组实现的,是一个动态数组,其容量能自动增长,类似于C语言中的动态申请内存,动态增长内存. ArrayList不是线程安全的,只能用在单线程环境下,多线 ...

  8. 如何阅读Java源码 阅读java的真实体会

    刚才在论坛不经意间,看到有关源码阅读的帖子.回想自己前几年,阅读源码那种兴奋和成就感(1),不禁又有一种激动. 源码阅读,我觉得最核心有三点:技术基础+强烈的求知欲+耐心.   说到技术基础,我打个比 ...

  9. 如何阅读Java源码

    刚才在论坛不经意间,看到有关源码阅读的帖子.回想自己前几年,阅读源码那种兴奋和成就感(1),不禁又有一种激动.源码阅读,我觉得最核心有三点:技术基础+强烈的求知欲+耐心. 说到技术基础,我打个比方吧, ...

随机推荐

  1. 云服务器Linux版本下---安装git

    xshell进入云服务器: 按照git官网:https://git-scm.com/download/linux   的教程输入: apt-get install git 本地没有包????? 原来是 ...

  2. python期末考试复习

    期末考试复习 补修的python跟着大一一起学,考试肯定不会出难,于是就敲了一些代码,把他们放到博客上,来记录一下 代码都是一段一段的,且python代码不是很多,所以我都写到了一个文件里,作为练习 ...

  3. indy tcpclient tcpServer

    procedure TForm1.FormCreate(Sender: TObject); begin IdTCPServer1.DefaultPort := ; IdTCPServer1.Activ ...

  4. 理解String的intern()方法

    API文档中的介绍: intern public String intern() Returns a canonical representation for the string object. A ...

  5. (4)关于Alpha通道问题

    其实,我还是不理解,我还是先把我目前懂得和觉得有用的东西先存下来 =================================================================== ...

  6. linux 下实用工具

    gpm 让linux 纯字符终端具备窗口模式下的鼠标功能 xterm + tmux 支持横向或者纵向切屏的终端 urxvt-unicode 支持中文的终端

  7. python中的API学习

    URL: url是统一资源定位符,对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址.互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该 ...

  8. Python说文解字_杂谈04

    1. 鸭子类型: 当你看到一只鸟走来像鸭子,游泳起来像鸭子,叫起来也像鸭子,他么他就可以叫做鸭子.任何可迭代的对象.一样的方法,可以用可迭代的话,就可以迭代的组合打印.__getitem__可以塞到任 ...

  9. 三阶平面魔方(BFS)

    有一个  3×3 的平面魔方,在平面魔方中,每个格子里分别无重复地写上 1 - 9 这 9 个数字.一共有 4 种对平面魔方的操作: 选择某一行左移. 选择某一行右移. 选择某一列上移. 选择某一列下 ...

  10. sourceTree 代码回滚(git 和http)

    近些时候,有遇到提交后代码有误的情况,所以需要回退到前一个版本.因为不常见,所以每次都不是很熟练,记录于此,以备查阅. 一.[将master重置到这次提交] 在sourceTree中选中错误的提交的下 ...