ArrayList详解-源码分析

1. 概述

在平时的开发中,用到最多的集合应该就是ArrayList了,本篇文章将结合源代码来学习ArrayList。

  • ArrayList是基于数组实现的集合列表
  • 支持任意性的访问(可根据索引直接得到你想要的元素)
  • 线程不安全
  • 支持动态扩容
  • 查询快,增删慢
  • ...

这些大家应该都很清楚,下面根据源代码来深入分析一下ArrayList。

2. ArrayList类声明

源代码如下所示:

  1. public class ArrayList<E> extends AbstractList<E>
  2. implements List<E>, RandomAccess, Cloneable, java.io.Serializable

初步分析:

  1. ArrayList类继承于AbstractList抽象类
  2. ArrayList类实现了List、RandomAccess、Cloneable、Serializable接口

继续分析一下:

  • AbstractList抽象类其实已经实现了Collection接口中大部分方法
  • 实现了RandomAccess接口,所以支持任意性访问(随机访问)
  • 实现了Cloneable接口,说明重写了 clone()方法,支持拷贝(Cloneable 接口只是个合法调用 clone() 的标识(marker-interface),一个对象想调用clone()方法,则该类必须实现Cloneable 接口,否则会报错 CloneNotSupportedException )
  • 实现了Serializable接口,支持序列化操作

3. 成员变量

源代码如下所示:

  1. private static final long serialVersionUID = 8683452581122892189L;
  2. /**
  3. * Default initial capacity.
  4. */
  5. private static final int DEFAULT_CAPACITY = 10;
  6. /**
  7. * Shared empty array instance used for empty instances.
  8. */
  9. private static final Object[] EMPTY_ELEMENTDATA = {};
  10. /**
  11. * Shared empty array instance used for default sized empty instances. We
  12. * distinguish this from EMPTY_ELEMENTDATA to know how much to inflate when
  13. * first element is added.
  14. */
  15. private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
  16. /**
  17. * The array buffer into which the elements of the ArrayList are stored.
  18. * The capacity of the ArrayList is the length of this array buffer. Any
  19. * empty ArrayList with elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA
  20. * will be expanded to DEFAULT_CAPACITY when the first element is added.
  21. */
  22. transient Object[] elementData; // non-private to simplify nested class access
  23. private int size;

初步思考:

  1. 一共有6个变量,各自的作用?

  2. 有两个空数组,只是命名不一样,为什么?

继续分析:

  1. 各个变量的作用:

    • serialVersionUID: 序列化版本号
    • DEFAULT_CAPACITY:默认容量大小
    • EMPTY_ELEMENTDATA:空数组时的引用
    • DEFAULTCAPACITY_EMPTY_ELEMENTDATA:初始化时默认的空数组
    • elementData:实际存储集合元素的数组
    • size:实际元素的数量(int类型默认值为0)
  2. 两个空数组:
    • 分别用于默认初始化和传入容量时的初始化

4. 构造方法

源代码如下所示:

  1. public ArrayList(int initialCapacity) {
  2. if (initialCapacity > 0) {
  3. this.elementData = new Object[initialCapacity];
  4. } else if (initialCapacity == 0) {
  5. this.elementData = EMPTY_ELEMENTDATA;
  6. } else {
  7. throw new IllegalArgumentException("Illegal Capacity: "+
  8. initialCapacity);
  9. }
  10. }
  11. public ArrayList() {
  12. this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
  13. }
  14. public ArrayList(Collection<? extends E> c) {
  15. elementData = c.toArray();
  16. if ((size = elementData.length) != 0) {
  17. // c.toArray might (incorrectly) not return Object[] (see 6260652)
  18. if (elementData.getClass() != Object[].class)
  19. elementData = Arrays.copyOf(elementData, size, Object[].class);
  20. } else {
  21. // replace with empty array.
  22. this.elementData = EMPTY_ELEMENTDATA;
  23. }
  24. }

初步思考:

  1. 提供了三个构造方法
  2. 分别对应无参构造、指定集合容量的构造以及通过Collection的子类来构造一个ArrayList对象

继续分析:

  1. 无参构造:

    • 直接将DEFAULTCAPACITY_EMPTY_ELEMENTDATA的空数组赋值给elementData(注意:此时ArrayList的数组长度还是0)
  2. 指定容量构造:

    • 参数大于0: 创建一个该参数大小的数组,赋值给elementData
    • 参数等于0: 将成员变量EMPTY_ELEMENTDATA数组赋值给elementData
    • 参数小于0: 抛出异常
  3. 传入Collection子类对象构造:

    1. public ArrayList(Collection<? extends E> c) {
    2. /**
    3. *将传入的集合转换为一个Object类型的数组,并将此数组的引用赋给elementData
    4. */
    5. elementData = c.toArray();
    6. if ((size = elementData.length) != 0) {// 转换后的数组不为空时
    7. /**
    8. * 判断转换后的数组是不是Object[]数组
    9. * 如果不是的话,就把它复制为一个Object[]数组,进行赋值
    10. */
    11. if (elementData.getClass() != Object[].class)
    12. elementData = Arrays.copyOf(elementData, size, Object[].class);
    13. } else {
    14. // 转换后的数组为空,用成员变量EMPTY_ELEMENTDATA来辅助
    15. this.elementData = EMPTY_ELEMENTDATA;
    16. }
    17. }

    toArray()方法源代码如下:

    1. public Object[] toArray() {
    2. return Arrays.copyOf(elementData, size);
    3. }

    Arrays类的copyOf()方法源代码如下:

    1. @SuppressWarnings("unchecked")
    2. public static <T> T[] copyOf(T[] original, int newLength) {
    3. // 此处的copyOf()调用了本类的重载方法
    4. return (T[]) copyOf(original, newLength, original.getClass());
    5. }

    重载方法源代码如下所示:

    1. public static <T,U> T[] copyOf(U[] original, int newLength, Class<? extends T[]> newType) {
    2. @SuppressWarnings("unchecked")
    3. T[] copy = ((Object)newType == (Object)Object[].class)
    4. ? (T[]) new Object[newLength]
    5. : (T[]) Array.newInstance(newType.getComponentType(), newLength);
    6. System.arraycopy(original, 0, copy, 0,
    7. Math.min(original.length, newLength));
    8. return copy;
    9. }

    代码分析:

    • 使用三元运算符进行判断传入数组的类型

    • 如果传入的数组类型强转为Object[]数组为true,则创建一个Object[newLength]数组赋值给copy

    • 如果为false,则利用反射获取到传入数组的类型,创建一个该类型的指定长度的数组赋值给copy

  • 调用native方法进行赋值

  • 最后返回copy

    调用链最后调用到了native方法上:

    1. public static native void arraycopy(Object src, int srcPos,Object dest, int destPos,
    2. int length);
    3. /**
    4. * 参数说明:
    5. * src:源对象
    6. * srcPos:源数组中的起始位置
    7. * dest:目标数组对象
    8. * destPos:目标数据中的起始位置
    9. * length:要拷贝的数组元素的数量
    10. */

源代码中最后都调用到了native方法,只能看到方法名和参数,看不到具体的实现,对native方法做个简单的介绍吧。

native声明的接口方法: Java代码和本地C代码进行互操作的API,称为Java Native Interface (Java本地接口)。也就是说,带有native标记的方法,都是使用C语言来实现的,读者了解到这里即可,感兴趣的可以去查阅下相关资料,这里就不多阐述了。

5. 常用方法分析

  • add(E e)

源代码如下所示:

  1. public boolean add(E e) {
  2. ensureCapacityInternal(size + 1); // Increments modCount!!
  3. elementData[size++] = e;
  4. return true;
  5. }

初步分析:

  1. 调用一个ensureCapacityInternal()方法,ensure Capacity Internal 直接谷歌翻译,意思是确保内部容量,此方法内应该就隐藏着ArrayList动态扩容的方法了!
  2. 将传入参数e,赋值给elementData[]数组中下标为size++的元素
  3. 返回true

继续跟踪ensureCapacityInternal()方法,该方法相关源代码如下所示:

  1. private void ensureCapacityInternal(int minCapacity) {
  2. if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
  3. minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
  4. }
  5. ensureExplicitCapacity(minCapacity);
  6. }

分析:

  1. 先对elementData数组进行空数组判断,注意:这里是直接使用 ==运算符来进行判断的,回顾下前面讲到的ArrayList的无参构造方法
  1. public ArrayList() {
  2. this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
  3. }

发现了没?如果使用默认的构造方法,调用的是DEFAULTCAPACITY_EMPTY_ELEMENTDATA空数组,执行add()方法之前,ArrayList数组的长度都是零,添加第一个元素后,数组的长度就变为10了。

  1. 下一个方法是ensureExplicitCapacity(),我们继续跟踪。

该方法源代码如下所示:

  1. private void ensureExplicitCapacity(int minCapacity) {
  2. modCount++;
  3. // overflow-conscious code
  4. if (minCapacity - elementData.length > 0)
  5. grow(minCapacity);
  6. }

初步分析:

  • 出现了一个前面没看到的变量modCount
  • 里面还有一个grow()方法,ArrayList能够动态扩容的原因就在这个方法里面了,八九不离十了!grow这个单词我还是认识的,哈哈哈~~~

继续分析:

  1. 经过追踪,发现modCount是ArrayList 的父类AbstractList的一个成员变量,作用是记录ArrayList的size变化,添加元素时,该变量会自增一次。
  2. minCapacity变量是要添加元素在elementData数组里的索引,当该变量值超过elementData数组长度的时候,elementData数组就要进行动态扩容了!

接下来,看下grow()方法的源代码,马上就要揭开ArrayList能够动态扩容的根本原因了,想想还有些激动,哈哈~

  1. private void grow(int minCapacity) {
  2. // overflow-conscious code
  3. int oldCapacity = elementData.length;
  4. int newCapacity = oldCapacity + (oldCapacity >> 1);
  5. if (newCapacity - minCapacity < 0)
  6. newCapacity = minCapacity;
  7. if (newCapacity - MAX_ARRAY_SIZE > 0)
  8. newCapacity = hugeCapacity(minCapacity);
  9. // minCapacity is usually close to size, so this is a win:
  10. elementData = Arrays.copyOf(elementData, newCapacity);
  11. }

分析:

  1. 将当前未添加新元素的elementData的数组长度赋值给oldCapacity变量,表示旧数组的容量

  2. 定义一个变量newCapacity,表示新数组的容量,新数组的容量大小为旧数组容量的1.5倍

    • 此处用到了移位操作,>>是移位运算符,表示带符号数右移
    • 向右移动n位,等同于除以2的n次方
  3. 此处需要注意一个地方,如果oldCapacity + (oldCapacity >> 1)执行的结果超过了int的最大值,即2的31次方减1,那么新数组的长度将变为负数

  4. 下面就是比较新数组容量和旧数组的容量,将较大的容量赋值给新数组

  5. 如果新数组的容量大小超过了定义的MAX_ARRAY_SIZE大小,那么将调用hugeCapacity()方法

代码如下:

  1. private static int hugeCapacity(int minCapacity) {
  2. if (minCapacity < 0) // overflow
  3. throw new OutOfMemoryError();
  4. return (minCapacity > MAX_ARRAY_SIZE) ?
  5. Integer.MAX_VALUE :
  6. MAX_ARRAY_SIZE;
  7. }
  • 传入的容量是负数,考虑到了数值溢出,抛出异常

  • 传入的容量超过了MAX_ARRAY_SIZE大小,则将Integer.MAX_VALUE的值进行返回,否则返回MAX_ARRAY_SIZE

  1. 最后调用Arrays.copyOf()方法,将旧数组复制到新数组中,至此便完成了数组的动态扩容
  • add(int index, E element)

源代码如下所示:

  1. public void add(int index, E element) {
  2. rangeCheckForAdd(index);
  3. ensureCapacityInternal(size + 1); // Increments modCount!!
  4. System.arraycopy(elementData, index, elementData, index + 1,
  5. size - index);
  6. elementData[index] = element;
  7. size++;
  8. }

基于add()方法的分析,分析如下:

  1. 判断索引是否越界
  2. 复制数组,进行移动
  3. 将传入参数赋值给指定下标的数组元素
  4. 集合长度加1

rangeCheckForAdd()方法源代码如下所示:

  1. private void rangeCheckForAdd(int index) {
  2. if (index > size || index < 0)
  3. throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
  4. }

分析如下:

  • 索引的上限是实际元素的长度,下限是0
  • 超过这两个边界值就会抛出异常

注意:由于此处判断范围上限取的实际元素的个数,那么就会造成一个情况,我们使用指定容量的构造方法,创建了一个ArrayList对象,然后使用add(int index, E element)方法时,当添加的index不是0时,就会报错

举例如下:

  1. public static void main(String[] args) {
  2. List<String> a = new ArrayList<>(12);// 初始化指定了数组的容量为12
  3. a.add(5, "element");
  4. }
  5. //结果如下:
  6. // Exception in thread "main" java.lang.IndexOutOfBoundsException: Index: 5, Size: 0
  7. // at java.util.ArrayList.rangeCheckForAdd(ArrayList.java:661)
  8. // at java.util.ArrayList.add(ArrayList.java:473)
  9. // at test.TestAddArrayList.main(TestAddArrayList.java:11)
  • get(int index)

源代码如下所示:

  1. public E get(int index) {
  2. rangeCheck(index);
  3. return elementData(index);
  4. }
  5. private void rangeCheck(int index) {
  6. if (index >= size)
  7. throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
  8. }
  9. E elementData(int index) {
  10. return (E) elementData[index];
  11. }

简要分析:

  1. 首先判断索引是否在正确的范围之内,此处仅仅只是判断了上限为实际元素个数

    • 超过上限时的报错提示信息为 "Index: "+index+", Size: "+size
    • 当index为负数时的报错提示信息则是:index,仅仅只是显示你访问的index值
  2. 调用elementData()方法,直接返回对应索引位置的元素
  • remove(int index)

源代码如下所示:

  1. public E remove(int index) {
  2. rangeCheck(index);
  3. modCount++;
  4. E oldValue = elementData(index);
  5. int numMoved = size - index - 1;
  6. if (numMoved > 0)
  7. System.arraycopy(elementData, index+1, elementData, index,
  8. numMoved);
  9. elementData[--size] = null; // clear to let GC do its work
  10. return oldValue;
  11. }

分析:

  1. 首先对index进行判断是否在正确的范围内
  2. 移除元素使得数组长度发生了变化,所以modCount++
  3. 计算需要移动的元素个数
  4. 调用arraycopy()方法进行数组元素的复制和移动
  5. 将数组实际长度的最后一位元素赋值为null,方便GC进行回收
  6. 最后返回索引位置的元素

不难看出,移除元素实际上也是数组的复制和移动

  • indexOf(Object o)

源码如下所示:

  1. public int indexOf(Object o) {
  2. if (o == null) {
  3. for (int i = 0; i < size; i++)
  4. if (elementData[i]==null)
  5. return i;
  6. } else {
  7. for (int i = 0; i < size; i++)
  8. if (o.equals(elementData[i]))
  9. return i;
  10. }
  11. return -1;
  12. }

indexOf方法是返回某元素在ArrayList对象里的下标(索引)。

分析:

  1. 区分两种情况

  2. 查询元素为null时,使用==运算符进行判断,返回索引

  3. 非null元素时,使用equals()方法来判断(ps:由此处调用的equals()方法,可以看出为什么不支持基本类型的元素)

  4. 当查询的元素不存在列表中,返回-1

ArrayList中还有很多方法,篇幅有限,在此不再赘述。

6. 总结

ArrayList是开发中用的最多了一个集合类了,很多时候我们只是停留在使用上面,没有深入的去学习,分析,为什么是这样?为什么会这样?有时候遇到问题了,也只能两眼一抹黑,不知道具体原因是什么,多看源码,多学习,提高解决问题的能力,一点点的进步,就好。

ArrayList详解-源码分析的更多相关文章

  1. LinkedList详解-源码分析

    LinkedList详解-源码分析 LinkedList是List接口的第二个具体的实现类,第一个是ArrayList,前面一篇文章已经总结过了,下面我们来结合源码,学习LinkedList. 基于双 ...

  2. Shiro的Filter机制详解---源码分析

    Shiro的Filter机制详解 首先从spring-shiro.xml的filter配置说起,先回答两个问题: 1, 为什么相同url规则,后面定义的会覆盖前面定义的(执行的时候只执行最后一个). ...

  3. Shiro的Filter机制详解---源码分析(转)

    Shiro的Filter机制详解 首先从spring-shiro.xml的filter配置说起,先回答两个问题: 1, 为什么相同url规则,后面定义的会覆盖前面定义的(执行的时候只执行最后一个). ...

  4. Java开源生鲜电商平台-盈利模式详解(源码可下载)

    Java开源生鲜电商平台-盈利模式详解(源码可下载) 该平台提供一个联合买家与卖家的一个平台.(类似淘宝购物,这里指的是食材的购买.) 平台有以下的盈利模式:(类似的平台有美菜网,食材网等) 1. 订 ...

  5. ArrayList 和 LinkedList 源码分析

    List 表示的就是线性表,是具有相同特性的数据元素的有限序列.它主要有两种存储结构,顺序存储和链式存储,分别对应着 ArrayList 和 LinkedList 的实现,接下来以 jdk7 代码为例 ...

  6. 2.8.2 并发下的ArrayList,以及源码分析

    package 第二章.并发下的ArrayList; import java.util.ArrayList;import java.util.List; /** * Created by zzq on ...

  7. List中的ArrayList和LinkedList源码分析

    ​ List是在面试中经常会问的一点,在我们面试中知道的仅仅是List是单列集合Collection下的一个实现类, List的实现接口又有几个,一个是ArrayList,还有一个是LinkedLis ...

  8. 设计模式(十七)——迭代器模式(ArrayList 集合应用源码分析)

    1 看一个具体的需求 编写程序展示一个学校院系结构:需求是这样,要在一个页面中展示出学校的院系组成,一个学校有多个学院, 一个学院有多个系.如图: 2 传统的设计方案(类图) 3 传统的方式的问题分析 ...

  9. JAVA ArrayList集合底层源码分析

    目录 ArrayList集合 一.ArrayList的注意事项 二. ArrayList 的底层操作机制源码分析(重点,难点.) 1.JDK8.0 2.JDK11.0 ArrayList集合 一.Ar ...

随机推荐

  1. js 一维数组,转成嵌套数组

    // 情况一: // 数据源var egs = [ {name_1: 'name_1...'}, {name_2: 'name_4...'}, {name_3: 'name_3...'}, {name ...

  2. 0day堆(2)堆的调试实验

    堆的调试实验 调试态堆管理策略和常态堆管理策略:前者只使用空表不用块表,不真实 使用调试器加载函数会触发前者 __asm int3 调试最真实的栈 未启用块表的堆区信息 堆区起始位置(假设为0x005 ...

  3. discuz修改禁止性别保密选项

    第一步找到source/function/function_profile.php 第二步  注释下面的代码 else { $html .= '<option value="0&quo ...

  4. php原生函数应用

    php常见基本的函数 一.字符串函数 implode — 将一个一维数组的值转化为字符串 lcfirst — 使一个字符串的第一个字符小写 ltrim — 删除字符串开头的空白字符(或其他字符) rt ...

  5. 2019-2020-1 20199310《Linux内核原理与分析》第三周作业

    1.问题描述 计算机的3大法宝是存储程序计算机,函数调用堆栈和中断机制,存储程序计算机已经在上一个博客中进行具体描述,本文将在剩下两方面出发对操作系统是如何工作的进行学习和探讨. 2.解决过程 2.1 ...

  6. 2019-2020-1 20199303《Linux内核原理与分析》第五周作业

    系统调用的三层机制 API:第一层是指Libc中定义的API,这些API封装了系统调用,使用int 0x80触发一个系统调用中断:当然,并非所有的API都使用了系统调用,如完成数学加减运算的API就没 ...

  7. mysql面试(1)

    一一个 SQL 执行行行的很慢,我们要分两种情况讨论:1.大大多数情况下很正常,偶尔很慢,则有如下原因(1).数据库在刷新脏⻚页,例例如 redo log 写满了了需要同步到磁盘.(2).执行行行的时 ...

  8. GithubAction-Deploy

    GithubAction-Deploy githubhexoaction 使用 github action 自动化部署 创建GitHub repository 存放源文件 在repo设置界面里添加Se ...

  9. js 之 JSON详解

    JSON:JavaScriptObjectNotation JSON是一种语法,用来序列化对象.数组.字符串.布尔值和null. JSON是基于JavaScript的语法,但与之不同 注意事项 JSO ...

  10. Docker虚拟化管理:30分钟教你学会用Docker

    关于Docker的官方介绍网上太多了我就不贴了,就实际体验来说Docker可以极大的简化环境搭建及服务部署的操作流程,大大降低部署的时间成本,解放你的双手. 本文不会深入讲解Docker底层架构及运行 ...