简介

ArrayList 是一个数组列表,相当于 动态数组。与Java中的数组相比,它的容量能动态增长。它继承于AbstractList,实现了List, RandomAccess, Cloneable, java.io.Serializable这些接口。

其继承关系如下:

源码分析

这里的代码是Java1.8的。

public class ArrayList<E>
extends AbstractList<E>
implements List<E>, RandomAccess, Cloneable, java.io.Serializable {}

实现接口

  • List
  • RandomAccess
  • Cloneable
  • java.io.Serializable

父类

  • AbstractList

字段

  • elementData:就是Object类型的数组。存储着ArrayList中真正的数据。其初始容量是10,之后会根据数据操作动态改变,具体发生在ensureCapacity()函数中。
  • size:表示列表中实际的元素数量,像一个指针,一直指着elementData中末尾元素的下一位。
  • serialVersionUID :意思是该类的版本序列号。(常量)
  • DEFAULT_CAPACITY:默认的初始数组大小。
  • EMPTY_ELEMENTDATA:在用初始容量值来初始化ArrayList的时候,如果设置大小为0,那么elementData就会指向这个空数组。
  • DEFAULTCAPACITY_EMPTY_ELEMENTDATA:没有指定初始化大小的时候,elementData就会指向这个空数组。
  • MAX_ARRAY_SIZE:列表的最大容量,就是int型的最大值。
    private static final long serialVersionUID = 8683452581122892189L;
private static final int DEFAULT_CAPACITY = 10;
private static final Object[] EMPTY_ELEMENTDATA = new Object[0];
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = new Object[0];
transient Object[] elementData;
private int size;
private static final int MAX_ARRAY_SIZE = 2147483639;

这里的transient是什么意思?

  1. transient关键字只能修饰变量,而不能修饰方法和类。注意,本地变量是不能被transient关键字修饰的。
  2. 被transient关键字修饰的变量不再能被序列化,一个静态变量不管是否被transient修饰,均不能被序列化。
  3. 一旦变量被transient修饰,变量将不再是对象持久化的一部分,该变量内容在序列化后无法获得访问。也可以认为在将持久化的对象反序列化后,被transient修饰的变量将按照普通类成员变量一样被初始化。

方法

分析几个比较重要的,能够体现其设计精髓的API。

1.扩容

	// 这个函数内部没有被使用到,应该是给外部调用的进行扩容的
public void ensureCapacity(int minCapacity) {
int minExpand = (elementData != DEFAULTCAPACITY_EMPTY_ELEMENTDATA)
// any size if not default element table
? 0
// larger than default for default empty table. It's already
// supposed to be at default size.
: DEFAULT_CAPACITY; if (minCapacity > minExpand) {
ensureExplicitCapacity(minCapacity);
}
}
// 内部扩容基本都调用的这个函数
private void ensureCapacityInternal(int minCapacity) {
// 看看是不是初次扩容,如果是就进行比较,如果需要扩容的数量小于10,那就直接扩到10
if (this.elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
var1 = Math.max(DEFAULT_CAPACITY, minCapacity);
} this.ensureExplicitCapacity(minCapacity);
}
// 明确可能需要扩容
private void ensureExplicitCapacity(int minCapacity) {
// 增加修改计数器
++this.modCount;
// 看看现有的数组大小够不够
if (minCapacity - this.elementData.length > 0) {
this.grow(minCapacity);
} } // 真正实现扩容的函数
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
// 从这里看出每次扩容的大小就是原来的1.5倍
int newCapacity = oldCapacity + (oldCapacity >> 1);
// 如果计算出来的新容量还小于期望的最小容量,那么就以期望最小容量作为扩容值
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
// 边界判断
newCapacity = hugeCapacity(minCapacity);
// 新建一个数组,将老的数据再拷贝进去
elementData = Arrays.copyOf(elementData, newCapacity);
} private static int hugeCapacity(int minCapacity) {
if (minCapacity < 0)
// 溢出
throw new OutOfMemoryError();
// 控制最大值
return (minCapacity > MAX_ARRAY_SIZE) ?
Integer.MAX_VALUE :
MAX_ARRAY_SIZE;
}

扩容触发条件
如果需求容量略大于现有容量,则进行扩容。

扩容大小
每次将新的容量提升为原来的1.5倍。

扩容原理
就重新构造一个新的更大的数组,然后通过数组拷贝工具函数将原来的数组的数据放进去。

2.添加元素

    // 添加元素
public boolean add(E e) {
// 看看是不是需要扩容
ensureCapacityInternal(size + 1); // modCount放在这个函数里面了
// 在末尾添加元素
elementData[size++] = e;
return true;
}

实现原理:先查看数组是否需要扩容,然后再到数组末尾添加新的元素。

3.元素查找

    // 正向查找,返回元素的索引值
public int indexOf(Object o) {
if (o == null) {
for (int i = 0; i < size; i++)
if (elementData[i]==null)
return i;
} else {
for (int i = 0; i < size; i++)
if (o.equals(elementData[i]))
return i;
}
return -1;
}

实现原理:就是挨个匹配,找到了就返回索引,没找到就返回-1。需要注意的是,List中填入的元素类型一定要实现equals方法,不然没法进行比较。

4.转化为数组

    // 返回ArrayList的Object数组
public Object[] toArray() {
return Arrays.copyOf(elementData, size);
} // 返回ArrayList的模板数组。所谓模板数组,即可以将T设为任意的数据类型
public <T> T[] toArray(T[] a) {
// 若数组a的大小 < ArrayList的元素个数;
// 则新建一个T[]数组,数组大小是“ArrayList的元素个数”,并将“ArrayList”全部拷贝到新数组中
if (a.length < size)
return (T[]) Arrays.copyOf(elementData, size, a.getClass()); // 若数组a的大小 >= ArrayList的元素个数;
// 则将ArrayList的全部元素都拷贝到数组a中。
System.arraycopy(elementData, 0, a, 0, size);
if (a.length > size)
a[size] = null;
return a;
}

注意点:
这里有两个方法可以转化为数组,通常我们使用第二个,因为第一个可能会丢出“java.lang.ClassCastException”异常,看源码,第一个直接把elementdata拷贝了就丢出来,返回的Object[]类型,而如果在外面对其进行类型转化,就会发生这个异常。因为Java出现向下转型可能会出现丢失,需要强制转换。

模板数组拷贝实现原理:

  • 就是需要传入一个模板数组,数组元素的类型就是程序员想要的,就不要在外面进行转换。
  • 如果传入的数组大小大于列表中数据的长度,通过把elementData中的元素拷贝到模板数组中,然后再返回就能得到想要的数组。
  • 如果传入数组大小小于列表中数组的长度,就重新建一个数组返回。

5.获取元素

	// 将Object类型转化为列表的泛型
E elementData(int index) {
return (E) elementData[index];
}
// 获取index位置的元素值
public E get(int index) {
rangeCheck(index); return elementData(index);
}

实现原理
首先先判断请求数据的索引是否合法,然后直接拿出来数组的元素然后转换,再丢出来。

6.删除元素

    // 删除ArrayList指定位置的元素
public E remove(int index) {
RangeCheck(index); modCount++;
E oldValue = (E) elementData[index]; int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
elementData[--size] = null; // Let gc do its work return oldValue;
}

实现原理
将想要删除元素的位置之后的元素都往前移动一个单位,然后将最后的数组指向空。
所以,ArrayList 删除中间元素的开销是很大的,如果该元素后面有很多元素,那么开销就是直线上升了。

为什么要将最后的元素指向空呢?
这样原来那个数组位置所指的实例就会失去引用,在之后的垃圾回收中就会被自动回收。

7.添加集合

    // 从index位置开始,将集合c添加到ArrayList
public boolean addAll(int index, Collection<? extends E> c) {
rangeCheckForAdd(index); Object[] a = c.toArray();
int numNew = a.length;
ensureCapacityInternal(size + numNew); // Increments modCount int numMoved = size - index;
if (numMoved > 0)
System.arraycopy(elementData, index, elementData, index + numNew,
numMoved); System.arraycopy(a, 0, elementData, index, numNew);
size += numNew;
return numNew != 0;
}

实现原理:
先把加进来的集合转化为数组,然后计算出需要插入的位置数量,插入位置后面的元素都向后移动该数量的步长,再将数据复制到相应的位置上。其实和插入一个数据的方法是差不多的。

8.克隆

    // 克隆函数
public Object clone() {
try {
ArrayList<?> v = (ArrayList<?>) super.clone();
// 拷贝原来列表中的数组元素到新列表的数组中
v.elementData = Arrays.copyOf(elementData, size);
v.modCount = 0;
return v;
} catch (CloneNotSupportedException e) {
// this shouldn't happen, since we are Cloneable
throw new InternalError(e);
}
}

实现原理
首先调用父类的克隆接口函数,产生一个新的实例。再将现在的数组和尺寸都拷贝到新的实例中,再返回。

9.构造方法

    public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
// 如果初始容量设置为0,就把elementData指向空
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException("Illegal Capacity: "+
initialCapacity);
}
} public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
} public ArrayList(Collection<? extends E> c) {
elementData = c.toArray();
if ((size = elementData.length) != 0) {
// c.toArray might (incorrectly) not return Object[] (see 6260652)
if (elementData.getClass() != Object[].class)
elementData = Arrays.copyOf(elementData, size, Object[].class);
} else {
// replace with empty array.
this.elementData = EMPTY_ELEMENTDATA;
}
}

提供了三种构造方法,分别是不设定初始值,设定初始大小和设定初始的集合。

从这里看出,如果ArrayList的初始容量没有设置,或者设置值为0,那么就会将elementData指向一个空数组,而1.6是直接新建了一个大小为10的数组,1.8很节省空间。

和之前不同的是,前两个构造函数中没有初始化size,因为size是对象的成员变量,分配到堆上,可以不初始化,默认就为0.

总结

源码总结

  1. ArrayList 实际上是通过一个数组去保存数据的。当我们构造ArrayList时;若使用默认构造函数,则ArrayList的默认容量大小是10
  2. 当ArrayList容量不足以容纳全部元素时,ArrayList会进行扩容:newCapacity = oldCapacity + (oldCapacity >> 1);”。
  3. ArrayList的克隆函数,即是将全部元素拷贝到一个数组中。
  4. ArrayList的中间插入和删除操作都需要将对应操作位置后的数据进行向后拷贝,所以,开销是不固定的,后面的元素越多,开销越大。
  5. ArrayList中数组保存数据,所以,读取中间的一个元素的随机访问速度很快。
  6. ArrayList中通过size字段保存其存储的元素数量,而实际占用的空间是elementData数组的大小,所以,除非执行了trimToSize()函数,将列表数据数量和数组元素数量保持同步,不然就会浪费后面的一段空间。
  7. ArrayList实现java.io.Serializable的方式。当写入到输出流时,先写入“容量”,再依次写入“每一个元素”;当读出输入流时,先读取“容量”,再依次读取“每一个元素”。

源码相关问题

源码中这个modCount是做什么的?
因为ArrayList和很多集合是线程不安全的,内部会通过modCount来记录线程对其的修改行为,add()、remove(),还是clear(),在有些情况下,修改行为的不可见是会出大问题,比如引用指向了其他的内存区域,这样就变成内存溢出攻击了。如果我们之前先将modCount数值保存下来,如果中间发现被其他线程修改了,那就直接抛出异常。
尤其是迭代器,在它的源码中有:if (modCount != expectedModCount) throw new ConcurrentModificationException();
所以,我们在有线程不安全的情况下,可以使用java.util.concurrent包下的集合,这些是线程安全的。

System.arraycopy() 和 Arrays.copyOf()的区别?
Arrays.copyOf()的底层还是对前者的调用。

ArrayList的遍历方式

  • 迭代器遍历
  • 随机访问遍历
  • foreach遍历

其中随机访问遍历的效率最高,时间短。foreach底层应该是使用了迭代器遍历,二者的开销差不多。但是迭代器访问也有好处,就是上面提到的,更安全。

Java集合源码分析(二)——ArrayList的更多相关文章

  1. Java集合源码分析之ArrayList

    ArrayList简介 从上图可以看到,ArrayList是集合框架中List接口的一个实现类,它继承了AbstractList类,实现了List, RandomAccess, Cloneable, ...

  2. Java集合源码分析之ArrayList(JDK1.8)

    package annoction; import java.util.*; import java.util.function.Consumer; import java.util.function ...

  3. Java集合源码分析(二)ArrayList

    ArrayList简介 ArrayList是基于数组实现的,是一个动态数组,其容量能自动增长,类似于C语言中的动态申请内存,动态增长内存. ArrayList不是线程安全的,只能用在单线程环境下,多线 ...

  4. java集合源码分析(三):ArrayList

    概述 在前文:java集合源码分析(二):List与AbstractList 和 java集合源码分析(一):Collection 与 AbstractCollection 中,我们大致了解了从 Co ...

  5. java集合源码分析(六):HashMap

    概述 HashMap 是 Map 接口下一个线程不安全的,基于哈希表的实现类.由于他解决哈希冲突的方式是分离链表法,也就是拉链法,因此他的数据结构是数组+链表,在 JDK8 以后,当哈希冲突严重时,H ...

  6. Java 集合源码分析(一)HashMap

    目录 Java 集合源码分析(一)HashMap 1. 概要 2. JDK 7 的 HashMap 3. JDK 1.8 的 HashMap 4. Hashtable 5. JDK 1.7 的 Con ...

  7. Java集合源码分析(三)LinkedList

    LinkedList简介 LinkedList是基于双向循环链表(从源码中可以很容易看出)实现的,除了可以当做链表来操作外,它还可以当做栈.队列和双端队列来使用. LinkedList同样是非线程安全 ...

  8. Java集合源码分析(四)Vector<E>

    Vector<E>简介 Vector也是基于数组实现的,是一个动态数组,其容量能自动增长. Vector是JDK1.0引入了,它的很多实现方法都加入了同步语句,因此是线程安全的(其实也只是 ...

  9. 集合源码分析[3]-ArrayList 源码分析

    历史文章: Collection 源码分析 AbstractList 源码分析 介绍 ArrayList是一个数组队列,相当于动态数组,与Java的数组对比,他的容量可以动态改变. 继承关系 Arra ...

  10. java集合源码分析几篇文章

    java集合源码解析https://blog.csdn.net/ns_code/article/category/2362915

随机推荐

  1. POSIX条件变量

    条件变量: 当一个线程互斥的访问某个变量时,它可能发现其他线程改变状态之前,它什么都做不了例如:一个线程访问队列时,发现队列为空,它只能等待,直到其他线程将一个节点添加到队列中,这种情况就需要使用条件 ...

  2. 聊一聊Token

    阔别了一阵,再次提笔,有些感慨. 聊聊Token吧,以前工作中总是遇到. 首先明确什么是token? 一些关键标签:服务端签发的一个字符串,客户端的请求令牌,用户第一次使用用户名密码登录后生成,在to ...

  3. Hadoop框架:MapReduce基本原理和入门案例

    本文源码:GitHub·点这里 || GitEE·点这里 一.MapReduce概述 1.基本概念 Hadoop核心组件之一:分布式计算的方案MapReduce,是一种编程模型,用于大规模数据集的并行 ...

  4. 装了IDM后看网页有时会自动弹出下载怎么办

    我们在安装了IDM之后,浏览一些网站时可能会自动弹文件下载窗口,但有时内容并非我们要下载的.对此类自动弹下载对话框的情况,操作者可进行自定义设置.不仅可通过设置文件格式来禁止自动弹窗,也可通过设置特定 ...

  5. 打开WPS时出现MathType错误弹窗怎么办

    MathType是一款特别优秀的公式编辑器,特别是在文档中出现大量的复杂数学公式需要编辑时.不过MathType与Office的兼容性还算好,与WPS的兼容性要略逊一筹,有时候会出现如下的报错弹窗.提 ...

  6. 通过城市联动实时将地址显示到text中

    <div class="form-group field-supplier-sort <?php if($model->getErrors('province_id') | ...

  7. Robot Framework安装和入门

    1:安装 python 安装python并且配置好环境变量 2:安装 Robot Framework pip install robotframework 3:安装GUI界面 pip install ...

  8. 安装kibana7.7.0

    ELK·Elastic Stack Elastic Stack就一套日志分析系统,前身叫ELK. E:Elasticsearch L:Logstash,日志收集系统 K:Kibana,数据可视化平台 ...

  9. miniconda安装及使用

    conda环境配置 安装conda [清华源下载地址](https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/) 官网或百度云网盘下载对应版本 ...

  10. c++11-17 模板核心知识(十)—— 区分万能引用(universal references)和右值引用

    引子 如何区分 模板参数 const disqualify universal reference auto声明 引子 T&&在代码里并不总是右值引用: void f(Widget&a ...