剑指CopyOnWriteArrayList
上期回顾
之前的一篇 剑指ConcurrentHashMap【基于JDK1.8】 给大家详细分析了一波JUC的ConcurrentHashMap,它在线程安全的基础上提供了更好的写并发能力。那么既然有map,是不是还有List呢?并发情况下应该用什么List嘞?接下来就是咋们的主角CopyOnWriteArrayList登场。
简介
首先咋们先看名字,比ArrayList多了个CopyOnWrite。CopyOnWrite啥意思?写时拷贝!OK,CopyOnWriteArrayList精髓你已经知道了,就是写时拷贝!很easy是把。
贴个比较官方的简介
CopyOnWrite容器即写时复制的容器。通俗的理解是当我们往一个容器添加元素的时候,不直接往当前容器添加,而是先将当前容器进行Copy,复制出一个新的容器,然后新的容器里添加元素,添加完元素之后,再将原容器的引用指向新的容器。这样做的好处是我们可以对CopyOnWrite容器进行并发的读,而不需要加锁,因为当前容器不会添加任何元素。所以CopyOnWrite容器也是一种读写分离的思想,读和写不同的容器。
先说说ArrayList的缺点
大家都知道ArrayList是属于线程不安全的一个集合,为什么不安全?咋们先看下它的添加操作源码
1 |
public boolean (E e) { |
很easy,里面有两步操作
- 判断列表的capacity容量是否足够,是否需要扩容
- 真正将元素放在列表的元素数组里面
ensureCapacityInternal()
这个方法的详细代码我们可以暂时不看,它的作用就是判断如果将当前的新元素加到列表后面,列表的elementData
数组的大小是否满足,如果size + 1的这个需求长度大于了elementData
这个数组的长度,那么就要对这个数组进行扩容。
这里就出现了线程安全问题,注意,add操作实际上不是一个原子操作,是分两步执行的,先扩容,后赋值。
问题出现在elementData[size++] = e
这里,它不是一个原子操作,可以分解为elementData[size] = e;
和size++
。当然,有经验的朋友可能还会说size++
也不是原子操作,对,没错,++其实在字节码指令里面被分成了三步操作,不懂的朋友可以参考我之前写的 CAS机制是什么鬼?
看测试案例:
开了20个线程进行add()操作1000次,理论上每次size应该都是20000,但是出现很多不足20000的情况。
由此可见是ArrayList做add操作时候,会丢失一些数据,个别情况还会报java.lang.ArrayIndexOutOfBoundsException
错!
值不足20000是典型的ArrayList多线程值覆盖问题。即AB线程同时进行add()方法,假设同时得到size为1,elementData[n]
的值被设置了两次,第二个线程设置的值将前一个覆盖,第一个值丢失。
另一种情况是报错,主要是因为扩容引起的。假设一个场景:
list容量为10,当前的size为9。线程AB同时add一个元素,A执行完ensureCapacityInternal(size + 1)
后,没达到扩容条件,此时容量还是为4,被挂起。B拿到CPU执行权,也执行了ensureCapacityInternal(size + 1)
,当然也不会进行扩容操作,接着执行elementData[size++] = e
后,B的值添加成功,size变成了4!OK!这时候A拿到CPU了,执行elementData[size++] = e
,因为这时size已经是4了,执行elementData[4]
就肯定会报数组越界异常了啊!
OK,缺点说完,那多线程情况下咋整呢?
Vector和Collections.synchronizedList
我们知道 Vector是线程安全的容器,因为它大部分方法都是用synchronized关键字确保线程安全,比如add():
1 |
public synchronized boolean (E e) { |
包括使用Collections.synchronizedList(new ArrayList())
来使ArrayList变成是线程安全,也和Vector实现方法差不多,比如add():
1 |
public void (int index, E element) { |
只不过它不是加在方法的声明处,而是方法的内部。
Vector和Collections.synchronizedList可能会出现的问题
有朋友就说了,咋还有问题啊,这是闹啥子啊??别急,听我慢慢道来。
直接贴案例图
我们在遍历Vector的时候,有别的线程修改了Vector的长度,可能会报java.lang.ArrayIndexOutOfBoundsException
错误。为什么呢?假设:A线程遍历Vector,发现Vector长度为25,这时候B线程进来了,吧Vector清空了,之后A继续执行vector.get(i)
操作的时候,抛出异常。
怎么解决??
很简单,加锁!
1 |
// 遍历Vector |
这样就不会有之前的问题了,但是你随便遍历个集合都要加个synchronized,性能方面肯定大打折扣的,这时候咋们的主角CopyOnWriteArrayList就出来了。
CopyOnWriteArrayList源码分析
看下add()方法:
1 |
public boolean (E e) { // 加锁 |
通过代码我们可以知道:在添加的时候就上锁,并复制一个新数组,增加操作在新数组上完成,将array指向到新数组中,最后解锁。
再看看set()方法:
1 |
public E set(int index, E element) { |
和add()方法有异曲同工之妙
总结:
- 在修改时,复制出一个新数组,修改的操作在新数组中完成,最后将新数组交由array变量指向。
- 写加锁,读不加锁
对之前两个案例进行改进:
1 |
public class Test2 { |
1 |
public class Test { |
测试运行是没有问题的。
CopyOnWriteArrayList的缺点
啥?CopyOnWriteArrayList还有缺点?ArrayList不行换Vector,Vector不行换CopyOnWriteArrayList,现在CopyOnWriteArrayList咋又不行啦??没完没了了??这代码我不敲了!!!
哈哈,不急不急,稍安勿躁,且听我慢慢道来。
CopyOnWriteArrayList也不是万金油,固然它有许多优点,但是也有两个缺点。
- 内存占用问题
因为CopyOnWrite的写时拷贝机制,所以在进行写操作的时候,内存里会同时驻扎两个对象的内存,旧的对象和新写入的对象(注意:在拷贝的时候只是拷贝容器里的引用,只是在写的时候会创建新对象添加到新容器里,而旧容器的对象还在使用,所以有两份对象内存)。如果这些对象占用的内存比较大,比如说200M左右,那么再写入100M数据进去,内存就会占用300M,那么这个时候很有可能造成频繁的Yong GC和Full GC。
针对内存占用问题,可以通过压缩容器中的元素的方法来减少大对象的内存消耗,比如,如果元素全是10进制的数字,可以考虑把它压缩成36进制或64进制。或者不使用CopyOnWrite容器,而使用其他的并发容器,比如ConcurrentHashMap。 - 数据一致性问题
CopyOnWrite容器只能保证数据的最终一致性,不能保证数据的实时一致性。所以如果你希望写入的的数据,马上能读到,请不要使用CopyOnWrite容器。
注意事项
- 使用CopyOnWriteArrayList应该尽量在创建时指定合适的大小,减少扩容开销,避免写时CopyOnWriteArrayList扩容的开销。
- 尽量使用批量添加方法
addAll()
,因为每次添加,容器每次都会进行复制,所以减少添加次数,可以减少容器的复制次数。
剑指CopyOnWriteArrayList的更多相关文章
- 剑指Offer面试题:1.实现Singleton模式
说来惭愧,自己在毕业之前就该好好看看<剑指Offer>这本书的,但是各种原因就是没看,也因此错过了很多机会,后悔莫及.但是后悔是没用的,现在趁还有余力,把这本书好好看一遍,并通过C#通通实 ...
- 剑指Offer面试题:14.链表的倒数第k个节点
PS:这是一道出境率极高的题目,记得去年参加校园招聘时我看到了3次,但是每次写的都不完善. 一.题目:链表的倒数第k个节点 题目:输入一个链表,输出该链表中倒数第k个结点.为了符合大多数人的习惯,本题 ...
- 《剑指offer》面试题12:打印1到最大的n位数
面试题12:打印1到最大的n位数 剑指offer题目12,题目如下 输入数字n,按顺序打印出1到最大的n位十进制数,比如输入3,则打印出1,2,3一直到最大的三位数999 方法一 和面试题11< ...
- 《剑指offer》面试题11: 数值的整数次方
面试题11: 数值的整数次方 剑指offer面试题11,题目如下 实现函数double power(double base,int exponent),求base的exponent次方, 不得使用库 ...
- 剑指 Offer 题目汇总索引
剑指 Offer 总目录:(共50道大题) 1. 赋值运算符函数(或应说复制拷贝函数问题) 2. 实现 Singleton 模式 (C#) 3.二维数组中的查找 4.替换空格 ...
- 面试题目——《剑指Offer》
1.把一个字符串转换成整数——<剑指Offer>P29 2.求链表中的倒数第k个结点——<剑指Offer>P30 3.实现Singleton模式——<剑指Offer> ...
- 剑指offer习题集2
1.把数组排成最小的数 class Solution { public: static bool compare(const string& s1, const string& s2) ...
- 剑指offer习题集1
1.打印二叉树 程序很简单,但是其中犯了一个小错误,死活找不到,写代码要注意啊 这里左右子树,要注意是node->left,结果写成root->left vector<int> ...
- 剑指Offer:面试题20——顺时针打印矩阵(java实现)
题目描述: 输入一个矩阵,按照从外向里以顺时针的顺序依次打印出每一个数 字,例如,如果输入如下矩阵: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 则依次打印出数字1, ...
随机推荐
- http协议笔记(不全)
1.URL 统一资源定位系统 URL由三部分组成:资源类型.存放资源的主机域名.资源文件名.url是统一资源定位符,对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址 ...
- ae基础一
1.导入素材2.整理素材3.创建合成1280*720是高清的模式 也是平时都用的格式 HDV/HDTV 720 251920*1080是超清的模式格式是以16:9的格式显示的 电脑电视机都是用这个比例 ...
- tensorflow C++接口调用目标检测pb模型代码
#include <iostream> #include "tensorflow/cc/ops/const_op.h" #include "tensorflo ...
- goweb-goweb基础
goweb DNS工作原理 在浏览器中输入www.qq.com域名,操作系统会先检查自己本地的hosts文件是否有这个网址映射关系,如果有,就先调用这个IP地址映射,完成域名解析. 如果hosts里没 ...
- Prometheus监控系统之入门篇(一)续
在上篇Prometheus监控系统之入门篇(一)中我们讲解了Prometheus的基本架构和工作流程, 并从0到1搭建了Prometheus服务,pushgateway以及告警系统. 本篇我们主要介绍 ...
- Spring和MyBatis的集成
Spring和MyBatis的整合 1. Spring和各个框架的整合 Spring目前是JavaWeb开发中最终的框架,提供一站式服务,可以其他各个框架整合集成 Spring整合方案 1.1. ...
- Linkage Disequilibrium|D‘|r2
I.10 Other Measures of Linkage Disequilibrium 因为D的取值强烈地依赖于人为制定的等位基因频率(PA及PB),所以它不利于LD程度的比较.标准化的不平衡系数 ...
- swank: (too proud or confident) 炫耀;卖弄 to behave in way that is too proud or confident
from : https://www.bing.com/dict/search?q=swank&qs=n&form=Z9LH5&sp=-1&pq=swank&s ...
- jenkins_2
1.jenkins pipline:一些列jenkins插件将整个CD(持续交付过程)用解释性代码Jenkinsfile来描述(之前的都是通过配置设置的,这次是通过file) 2.创建一个流水线任务 ...
- 52)PHP,加了单例模式的数据库代码
<?php class db { public $host ;//= "localhost";//定义默认连接方式 public $User;//= "root&q ...