概述

  ConcurrentLinkedQueue是一种基于链表实现的无界非阻塞线程安全队列,遵循先入先出规则。

  线程安全队列有两种实现方式:

    阻塞方式:对入队和出队操作加锁。阻塞队列。

    非阻塞方式:通过自旋CAS实现。例如:ConcurrentLinkedQueue

  下面从源代码中分析ConcurrentLinkedQueue的实现方法。

类关系图

      

    从类图可以看出,ConcurrentLinkedQueue有head和tail两个volatile域,节点是用静态内部类Node表示,每个Node含有元素item和指向下一个节点的指针next,都是volatile变量。

源码分析

  Node源码

    Node的item和next两个域都是volatile变量,保证可见性。casItem和casNext方法使用了UNSAFE提供的CAS方法保证操作的原子性。

         //Node代码中使用了UNSAFE提供的CAS方法保证操作的原子性,
//UNSAFE.compareAndSwapObject(this, nextOffset, cmp, val);
//第一个参数表示要更新的对象,第二个参数nextOffset是Field的偏移量,第三个参数表示期望值,最后一个参数更新后的值。若next域的值等于cmp,则把next域更新为val并返回true;否则不更新并返回false。
private static class Node<E> {
volatile E item; //Node值,volatile保证可见性
volatile Node<E> next; //Node的下一个元素,volatile保证可见性 /**
* Constructs a new node. Uses relaxed write because item can
* only be seen after publication via casNext.
*/
Node(E item) {
UNSAFE.putObject(this, itemOffset, item);
} boolean casItem(E cmp, E val) {
return UNSAFE.compareAndSwapObject(this, itemOffset, cmp, val);
} void lazySetNext(Node<E> val) {
UNSAFE.putOrderedObject(this, nextOffset, val);
} boolean casNext(Node<E> cmp, Node<E> val) {
return UNSAFE.compareAndSwapObject(this, nextOffset, cmp, val);
} // Unsafe mechanics private static final sun.misc.Unsafe UNSAFE;
private static final long itemOffset;
private static final long nextOffset; static {
//初始化UNSAFE和各个域在类中的偏移量
try {
UNSAFE = sun.misc.Unsafe.getUnsafe();//初始化UNSAFE
Class k = Node.class;
//itemOffset是指类中item字段在Node类中的偏移量,先通过反射获取类的item域,然后通过UNSAFE获取item域在内存中相对于Node类首地址的偏移量。
itemOffset = UNSAFE.objectFieldOffset
(k.getDeclaredField("item"));
//nextOffset是指类中next字段在Node类中的偏移量
nextOffset = UNSAFE.objectFieldOffset
(k.getDeclaredField("next"));
} catch (Exception e) {
throw new Error(e);
}
}
}

    Node类中的lazySetNext(Node<E> val)方法,可以理解为延迟设置Next,内部是使用UNSAFE类的putOrderedObject方法实现,putOrderedXXX方法是putXXXVolatile方法的延迟实现,不保证值的改变被其他线程立即看到。为什么要lazySetNext这个方法呢?其实它是一种低级别的优化手段,就是在不需要让共享变量的修改立刻让其他线程可见的时候,以设置普通变量的方式来修改共享状态,可以减少不必要的内存屏障,从而提高程序执行的效率。

    《Java内存模型中》提到volatile变量可以实现可见性,其原理就是插入内存屏障以保证不会重排序指令,使用的是store-load内存屏障,开销较大。UNSAFE类的putOrderedXXX方法则是在指令中插入StoreStore内存屏障,避免发生写操作重排序,由于StoreStore屏障的性能损耗小于StoreLoad屏障,所以lazySetNext方法比直接写volatile变量的性能要高。需要注意的是,StoreStore屏障仅可以避免写写重排序,不保证内存可见性。

    在出队操作中更新Queue的Head节点时用到了lazySetNext(Node<E> val)方法,将旧head节点的next指向自己。

  初始化

    创建一个空的Queue,head节点为null且tail节点等于head节点。

             //创建一个空的Queue,head节点为null且tail节点等于head节点
public ConcurrentLinkedQueue() {
head = tail = new Node<E>(null); }

  入队

    入队的方法为offer,向队列的尾部插入指定的元素,由于ConcurrentLinkedQueue是无界的,所以offer永远返回true,不能通过返回值来判断是否入队成功。

    入队大致有以下几个步骤:

      1)根据tail节点定位出尾节点(last node);

      2)将新节点置为尾节点的下一个节点;

      3)更新尾节点casTail。

         //向队列的尾部插入指定的元素
public boolean offer(E e) {
checkNotNull(e);
final Node<E> newNode = new Node<E>(e);//构造新Node
//循环CAS直到入队成功。1、根据tail节点定位出尾节点(last node);2、将新节点置为尾节点的下一个节点,3、更新尾节点casTail。
for (Node<E> t = tail, p = t;;) {
Node<E> q = p.next;
if (q == null) { //判断p是不是尾节点,tail节点不一定是尾节点,判断是不是尾节点的依据是该节点的next是不是null
// p is last node
if (p.casNext(null, newNode)) {
//设置P节点的下一个节点为新节点,如果p的next为null,说明p是尾节点,casNext返回true;如果p的next不为null,说明有其他线程更新过队列的尾节点,casNext返回false。
// Successful CAS is the linearization point
// for e to become an element of this queue,
// and for newNode to become "live".
if (p != t) // hop two nodes at a time
casTail(t, newNode); // Failure is OK.
return true;
}
// Lost CAS race to another thread; re-read next
}
else if (p == q)
//p节点是null的head节点刚好被出队,更新head节点时h.lazySetNext(h)把旧的head节点指向自己
// We have fallen off list. If tail is unchanged, it
// will also be off-list, in which case we need to
// jump to head, from which all live nodes are always
// reachable. Else the new tail is a better bet.
p = (t != (t = tail)) ? t : head;
else
// Check for tail updates after two hops.
p = (p != t && t != (t = tail)) ? t : q;
//判断tail节点有没有被更新,如果没被更新,1)p=q:p指向p.next继续寻找尾节点;
//如果被更新了,2)p=t:P赋值为新的tail节点
//p != t && t != (t = tail)是怎么执行的?见随笔附录《通过字节码指令分析 p != t && t != (t = tail) 语句的执行》
//什么情况下p!=t.只有本分支和else if (p == q)分支含有更新变量p和t的语句,所以在p!=t出现之前已经循环过这两个分支至少一次。 }
} private boolean casTail(Node<E> cmp, Node<E> val) {
return UNSAFE.compareAndSwapObject(this, tailOffset, cmp, val);
}

    需要注意的是:tail不总是尾节点(last node)。DougLea大师为什么这么设计呢?把tail节点永远作为Queue的尾节点实现起来不是更简单吗?

    下面是tail节点永远作为Queue的尾节点的入队方法代码:

         public boolean offer(E e) {
if (e == null)
throw new NullPointerException();
Node<E> n = new Node<E>(e);
for (;;) {
Node<E> t = tail;
//此处如果casNext成功,那么casTail可能会成功。因为在这两个原子操作期间,其他线程的casNext操作都会失败,之后的casTail不会被执行,即tail节点不变。
if (t.casNext(null, n) && casTail(t, n)) {
return true;
}
}
}

    这么做的缺点是每次入队都会自旋CAS更新tail节点,入队效率会降低,而DougLea的设计通过hops变量来减少入队时减少更新tail节点的次数,默认情况下hops为1。当tail节点与尾节点的距离大于等于hops值时才更新Queue的tail节点。这样带来的坏处是入队时需要根据tail定位尾节点,hops的值越大,定位时间就越长。DougLea的设计思想是通过增加对volatile变量的读来减少对volatile变量的写,而写操作的开销远远大于读操作。所以从总体上来说入队效率是提升的。

  出队

    和入队相似,出队时也不是每次都会更新head节点,当head节点的item不为null时,直接弹出item;否则会更新head节点。更新head节点成功时,会把旧的head节点指向自己。

             public E poll() {
restartFromHead:
//两层循环
for (;;) {
for (Node<E> h = head, p = h, q;;) {
E item = p.item; if (item != null && p.casItem(item, null)) {
// Successful CAS is the linearization point
// for item to be removed from this queue.
if (p != h) // hop two nodes at a time
updateHead(h, ((q = p.next) != null) ? q : p);
return item;
}
//队列为空,更新head节点
else if ((q = p.next) == null) {
updateHead(h, p);
return null;
}
else if (p == q)
//p节点是null的head节点刚好被出队,更新head节点时h.lazySetNext(h);把旧的head节点指向自己。
//重新从head节点开始
continue restartFromHead;
else
p = q; //将p执行p的下一个节点
}
}
} //更新head节点
final void updateHead(Node<E> h, Node<E> p) {
//通过CAS将head更新为P
if (h != p && casHead(h, p))
h.lazySetNext(h);//把旧的head节点指向自己
} void lazySetNext(Node<E> val) {
UNSAFE.putOrderedObject(this, nextOffset, val);
}

 

  队列大小

    注意:size()需要遍历队列中的所有元素,时间复杂度为O(n),开销较大。并且如果在遍历的过程中,Queue有入队或出队的操作,会导致该方法统计的结果不准确。所以size()方法不太有用。那如何判断Queue是否为空呢?使用isEmpty()方法,判断第一个节点是否为null,时间复杂度为O(1)

         public int size() {
int count = 0;
for (Node<E> p = first(); p != null; p = succ(p))
if (p.item != null)
// Collection.size() spec says to max out
if (++count == Integer.MAX_VALUE)
break;
return count;
}

附录:通过字节码指令分析 p != t && t != (t = tail) 语句的执行

  在读ConcurrentLinkedQueue源代码时,在入队方法的定位尾节点中读到 p = (p != t && t != (t = tail)) ? t : q; 语句,不太理解 p != t && t != (t = tail) 的执行顺序,遂通过反汇编语句仔细研究一下。

  我们都知道 A && B 运算,在A不满足条件的情况下,B将不会执行。那在字节码指令中是怎么实现的呢?

  通过以下代码模拟:

             public class Test {
public static void main(String[] args) {
int t = 8;
int p = t;
int tail = 9;
boolean result = (p != t && t != (t = tail));
System.out.println("p=" + p + ", t=" + t + ", result=" + result);
}
}

  不出所料,运行结果为p=8, t=8, result=false。t=8说明没有执行t != (t = tail)语句。

  看反汇编后的字节码指令:

         public class Test {
public static void main(java.lang.String[] args);
0 bipush 8 //将单字节常量(-128~127)压入栈顶
2 istore_1 [t] //将栈顶int型数值存入第二个本地变量,即赋值给变量t,同时常量8出栈
3 iload_1 [t] //将第二个int型本地变量(t)压入栈顶
4 istore_2 [p] //将栈顶int型数值存入第三个本地变量,即赋值给变量P,同时t出栈
5 bipush 9
7 istore_3 [tail]
8 iload_2 [p]
9 iload_1 [t]
10 if_icmpeq 24 //比较栈顶两int型数值大小,当结果等于0时跳转。即比较p!=t,结果为false(0),跳转到24行,同时p和t出栈
13 iload_1 [t]
14 iload_3 [tail]
15 dup
16 istore_1 [t]
17 if_icmpeq 24
20 iconst_1
21 goto 25
24 iconst_0 //将int型0压入栈顶。
25 istore 4 [result] //将栈顶int型数值存入指定本地变量。即将result赋值为0(false)
27 return
}

  接下来再看一下第一个条件成立时的情况。代码将p != t改为p == t:

             public class Test {
public static void main(String[] args) {
int t = 8;
int p = t;
int tail = 9;
boolean result = (p == t && t != (t = tail));
System.out.println("p=" + p + ", t=" + t + ", result=" + result);
}
}

  先来看运行结果p=8, t=9, result=true。说明执行了t != (t = tail)语句。

  看反汇编后的字节码指令:

         public class Test {
public static void main(java.lang.String[] args);
0 bipush 8
2 istore_1 [t]
3 iload_1 [t]
4 istore_2 [p]
5 bipush 9
7 istore_3 [tail]
8 iload_2 [p]
9 iload_1 [t]
10 if_icmpne 24 //比较栈顶两int型数值大小,当结果不等于0时跳转。即比较p == t,结果为true(1)。所以不会跳转到24行,继续执行下一行。
13 iload_1 [t] //将变量t压入栈顶,此时t=8
14 iload_3 [tail] //将变量tail压入栈顶,tail=9
15 dup //复制栈顶数值并将复制值压入栈顶。即复制tail变量值并压入栈顶,tail=9
16 istore_1 [t] //将栈顶数值存入t变量,同时出栈
17 if_icmpeq 24 //比较栈顶两int型数值大小,当结果等于0时跳转。此时栈顶有9、8。比较9!=8,结果为true(1)。所以不会跳转到24行,继续执行下一行。
20 iconst_1 //将int型1压入栈顶
21 goto 25 //无条件跳转到25行
24 iconst_0
25 istore 4 [result] //将栈顶1存入result,同时出栈。即result返回true
27 return
}

  通过字节码指令分析可知,编译器是通过if_icmpeq和if_icmpne比较并条件跳转指令实现&&短路与运算的。在第二种情况中,还分析了t != (t = tail)语句的执行过程,理解会更加深入。

参考资料:

  《Java并发编程的艺术》

  ConcurrentLinkedQueue源码分析(http://www.jianshu.com/p/7816c1361439)

Java并发容器--ConcurrentLinkedQueue的更多相关文章

  1. Java并发编程系列-(5) Java并发容器

    5 并发容器 5.1 Hashtable.HashMap.TreeMap.HashSet.LinkedHashMap 在介绍并发容器之前,先分析下普通的容器,以及相应的实现,方便后续的对比. Hash ...

  2. Java 并发系列之六:java 并发容器(4个)

    1. ConcurrentHashMap 2. ConcurrentLinkedQueue 3. ConcurrentSkipListMap 4. ConcurrentSkipListSet 5. t ...

  3. 《Java并发编程的艺术》第6/7/8章 Java并发容器与框架/13个原子操作/并发工具类

    第6章 Java并发容器和框架 6.1  ConcurrentHashMap(线程安全的HashMap.锁分段技术) 6.1.1 为什么要使用ConcurrentHashMap 在并发编程中使用Has ...

  4. java 并发容器一之BoundedConcurrentHashMap(基于JDK1.8)

    最近开始学习java并发容器,以补充自己在并发方面的知识,从源码上进行.如有不正确之处,还请各位大神批评指正. 前言: 本人个人理解,看一个类的源码要先从构造器入手,然后再看方法.下面看Bounded ...

  5. Java并发编程原理与实战三十五:并发容器ConcurrentLinkedQueue原理与使用

    一.简介 一个基于链接节点的无界线程安全队列.此队列按照 FIFO(先进先出)原则对元素进行排序.队列的头部 是队列中时间最长的元素.队列的尾部 是队列中时间最短的元素.新的元素插入到队列的尾部,队列 ...

  6. java并发容器(Map、List、BlockingQueue)

    转发: 大海巨浪 Java库本身就有多种线程安全的容器和同步工具,其中同步容器包括两部分:一个是Vector和Hashtable.另外还有JDK1.2中加入的同步包装类,这些类都是由Collectio ...

  7. java并发容器(Map、List、BlockingQueue)具体解释

    Java库本身就有多种线程安全的容器和同步工具,当中同步容器包含两部分:一个是Vector和Hashtable.另外还有JDK1.2中增加的同步包装类.这些类都是由Collections.synchr ...

  8. 14个Java并发容器,你用过几个?

    作者:acupt 前言 不考虑多线程并发的情况下,容器类一般使用ArrayList.HashMap等线程不安全的类,效率更高.在并发场景下,常会用到ConcurrentHashMap.ArrayBlo ...

  9. 深入浅出14个Java并发容器

    前言 不考虑多线程并发的情况下,容器类一般使用ArrayList.HashMap等线程不安全的类,效率更高.在并发场景下,常会用到ConcurrentHashMap.ArrayBlockingQueu ...

随机推荐

  1. Hive的数据库和表

    本文介绍一下Hive中的数据库(Database/Schema)和表(Table)的基础知识,由于篇幅原因,这里只是一些常用的.基础的. Hive的数据库和表 先看一张草图: Hive结构 从图上可以 ...

  2. 学习python第十二天,函数4 生成器generator和迭代器Iterator

    在Python中,这种一边循环一边计算的机制,称为生成器:generator 要创建一个generator,有很多种方法.第一种方法很简单,只要把一个列表生成式的[]改成(),就创建了一个genera ...

  3. pycharm中文乱码问题 总结

    前言: 这几天刚刚开始学习python,然后就安装了pycharm,但是那个中文乱码的问题真是让人心烦,在网上找了好久,都写得好乱,今天终于让我解决了,在这里总结一下经验,希望可以帮到你们 问题:如下 ...

  4. 前言 openwrt简介

    什么是openwrt?先看一下度娘怎么说. OpenWRT是一个高度模块化.高度自动化的嵌入式Linux系统,拥有强大的网络组件和扩展性,常常被用于工控设备.电话.小型机器人.智能家居.路由器以及VO ...

  5. python创建字典

    创建: {x:x**2 for x in (2,4,6)} dict(xjm=110,lxh=119,pzq=120) dict([('a',1),('b',2),('c',3)])

  6. 大话目标检测经典模型(RCNN、Fast RCNN、Faster RCNN)

      目标检测是深度学习的一个重要应用,就是在图片中要将里面的物体识别出来,并标出物体的位置,一般需要经过两个步骤:1.分类,识别物体是什么 2.定位,找出物体在哪里 除了对单个物体进行检测,还要能支持 ...

  7. 12 KLT算法

    1 去除多余模块的 #-*- coding:utf-8 -*- ''' Lucas-Kanade tracker ==================== Lucas-Kanade sparse op ...

  8. sourceInsight *** more bytes are required

    现象:用sourceinsight修改的文件无法保存,提示 No enough space to save "XXX", xxx more bytes are required. ...

  9. JavaSE总结--面向对象

    封装: 1)为什么要用private修饰 保护属性或方法不被别人随意调用. 继承: 继承模型: 多态: 接口: 抽象类: 内部类: 在编译时用$分隔. 访问局部变量,该变量必须用final修饰. 向下 ...

  10. 《1024伐木累》-小白篇之丽jie(结束篇)-总章节六

    往期回顾:  机缘巧合,月侠发现了老王和他心仪女孩儿的秘密,这让他倍感愤怒,一年以后,丽姐又在去往老王家的路上,这让月侠感到历史即将重新上演,他想拦住丽姐,可恰巧丽姐手机没电,失去了联系. 小序 有人 ...